Abbiamo un sistema cms che scrive blocchi di contenuto html nel database del server SQL. Conosco il nome della tabella e il nome del campo in cui risiedono questi blocchi di contenuto HTML. Alcuni html contengono collegamenti() a file PDF. Ecco un frammento:Come estrarre i nomi di file da un campo che contiene contenuto html nel server sql?
<p>A deferred tuition payment plan,
or view the <a href="/uploadedFiles/Tuition-Reimbursement-Deferred.pdf"
target="_blank">list</a>.</p>
Ho bisogno di estrarre i nomi di file pdf da tutti questi blocchi di contenuto html. Alla fine ho bisogno di ottenere un elenco:
Tuition-Reimbursement-Deferred.pdf
Some-other-file.pdf
di tutti i nomi di file pdf da quel campo.
Qualsiasi aiuto è apprezzato. Grazie.
UPDATE
Ho ricevuto molte risposte, grazie mille, ma ho dimenticato di dire che stiamo ancora usando SQL Server 2000 qui. Quindi, questo doveva essere fatto usando SQL 2000 SQL.
Saranno tutti hanno una cartella che precede il nome del file? –
Devi farlo in TSQL? È un linguaggio molto scarso per l'analisi del testo, e sarebbe molto più semplice in una lingua diversa che ha una libreria di analisi HTML. – Pondlife
D'accordo, questa è solo una rapida opzione. Se necessario, userò HTMLAgilityPack nel mio codice C# per analizzare il contenuto. – monstro