TableParse (version 2.0)
index
/home/dmcc/prj/pyph/TableParse.py

This is a simple HTML table parser, modelled loosely after Perl's HTML::TableExtract.
 
The parse() function accepts an HTML function and returns a list of lists.
 
See http://bebop.bigasterisk.com/python for more Python stuff.
This file is available under the GPLv2 license.

 
Modules
            
pre
 
Functions
            
clean(str)
Removes tags and surrounding whitespace
ent_maker(ent)
Make regexes that match entities
parse(str, head=None, cleaner=<function clean>)
Parse a string, given optionally a list of header entries:
 
parse('<HTML>...(snip)...</HTML>', ['first name', 'last name'])
 
A function to cleanup the HTML may be specified if you don't like
the behavior of the original one.  It will return a list of lists.
tag_maker(tag, close_tag=None)
Make regexes that match HTML tags
 
Data
             __all__ = ['clean', 'parse']
__author__ = 'David McClosky (dmcc@bigasterisk.com)'
__file__ = './TableParse.py'
__license__ = 'GPLv2'
__name__ = 'TableParse'
__version__ = '2.0'
cel = <pre.RegexObject instance>
ent = {<pre.RegexObject instance>: '&', <pre.RegexObject instance>: '<', <pre.RegexObject instance>: '>', <pre.RegexObject instance>: ' '}
hdr = <pre.RegexObject instance>
new = ' '
old = 'nbsp'
row = <pre.RegexObject instance>
tag = <pre.RegexObject instance>
tbl = <pre.RegexObject instance>
 
Author
             David McClosky (dmcc@bigasterisk.com)