cerco di praticare "HtmlAgilityPack", ma sto avendo alcuni problemi riguardanti questo. ecco quello che ho codificato, ma non riesco a ottenere correttamente il titolo e la descrizione di una pagina web ... Se qualcuno mi può illuminare su un mio errore :)HtmlAgilityPack ottenere Titolo e meta
public static void Main(string[] args)
string link = null;
string str;
string answer;
int curloc; // holds current location in response
string url = "http://stackoverflow.com/";
HttpWebRequest HttpWReq = (HttpWebRequest)WebRequest.Create(url);
HttpWReq.UserAgent = @"Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv: Gecko/20091102 Firefox/3.5.5";
HttpWebResponse HttpWResp = (HttpWebResponse)HttpWReq.GetResponse();
//url = null; // disallow further use of this URI
Stream istrm = HttpWResp.GetResponseStream();
// Wrap the input stream in a StreamReader.
StreamReader rdr = new StreamReader(istrm);
// Read in the entire page.
str = rdr.ReadToEnd();
curloc = 0;
//WebPage result;
// Find the next URI to link to.
link = FindLink(str, ref curloc); //return the good link
Console.WriteLine("Title found: " + curloc);
//title = Title(str, ref curloc);
if (link != null)
Console.WriteLine("Link found: " + link);
using (System.Net.WebClient client = new System.Net.WebClient())
HtmlDocument htmlDoc = new HtmlDocument();
var html = client.DownloadString(url);
htmlDoc.LoadHtml(link); //chargement de HTMLAgilityPack
var htmlElement = htmlDoc.DocumentNode.Element("html");
HtmlNode node = htmlDoc.DocumentNode.SelectSingleNode("//meta[@name='description']");
if (node != null)
string desc = node.GetAttributeValue("content", "");
Console.Write("DESCRIPTION: " + desc);
Console.WriteLine("No description");
var titleElement =
if (titleElement != null)
string title = titleElement.InnerText;
Console.WriteLine("Titre: {0}", title);
Console.WriteLine("no Title");
Console.Write("Link, More, Quit?");
answer = Console.ReadLine();
Console.WriteLine("No link found.");
} while (link.Length > 0);
// Close the Response.
} while (url != null);
catch{ ...}
Grazie in anticipo :)
C'è un meta tag su stackoverflow? Il mio browser non mostra nel codice sorgente della pagina –
A proposito del titolo: basta provare htmlDoc.DocumentNode.SelectSingleNode ("// titolo") –
sì, non ci sono meta tag su StackOverflow ... e con "HtmlNode nodo = HTMLDOC .DocumentNode.SelectSingleNode ("// titolo");" il risultato è vuoto ... –