Ho qualche problema con il metodo re.finditer() in python. Per esempio:re.finditer() che restituisce lo stesso valore per i metodi di inizio e fine
>>>sequence = 'atgaggagccccaagcttactcgatttaacgcccgcagcctcgccaaaccaccaaacacacca'
>>>[[m.start(),m.end()] for m in re.finditer(r'(?=gatttaacg)',sequence)]
out: [[22,22]]
Come si può vedere, le start()
e end()
metodi stanno dando lo stesso valore. L'ho notato prima e ho appena finito di usare m.start()+len(query_sequence)
, invece di m.end()
, ma sono molto confuso perché questo sta accadendo.
Perché stai utilizzando un lookahead? –
Sto usando il lookahead perché voglio corrispondenze sovrapposte. Ad esempio, se stavo cercando aca, vorrei che l'acaca contasse 2 occorrenze invece di 1 – lstbl
Beh, sai la lunghezza della sequenza richiesta, quindi perché hai bisogno di 'm.end()'? – kay