Questo codice fa quasi quello che ho bisogno di ..Python split() senza rimuovere il delimitatore
for line in all_lines:
s = line.split('>')
Solo che rimuove tutti i '>' delimitatori.
Quindi,
<html><head>
si trasforma in
['<html','<head']
C'è un modo per utilizzare il metodo, ma () diviso mantenere il delimitatore, invece di rimuoverlo?
Con questi risultati ..
['<html>','<head>']
Questo in realtà non rispondere alla tua domanda, ma se si sta cercando di analizzare HTML in Python, mi raccomando [Beautiful Soup] (http://www.crummy.com/software/BeautifulSoup/). –
Vedere anche [In Python, come posso dividere una stringa e mantenere i separatori?] (Http://stackoverflow.com/questions/2136556/in-python-how-do-i-split-a-string-and- keep-the-separatori). – outis