今天就跟大家聊聊有关利用ASP.NET怎么抓取网页内容,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。
创新互联建站长期为1000多家客户提供的网站建设服务,团队从业经验10年,关注不同地域、不同群体,并针对不同对象提供差异化的产品和服务;打造开放共赢平台,与合作伙伴共同营造健康的互联网生态环境。为丘北企业提供专业的成都网站设计、做网站,丘北网站改版等技术服务。拥有十余年丰富建站经验和众多成功案例,为您定制开发。
asp.net 抓取网页内容需要三个类:WebRequest、WebResponse、StreamReader。
WebRequest、WebResponse 的名称空间是:
System.Net
StreamReader 的名称空间是:
System.IO
ASP.NET抓取网页内容核心代码
WebRequest request = WebRequest.Create("http://www.cftea.com/"); WebResponse response = request.GetResponse(); StreamReader reader = new StreamReader(response.GetResponseStream(), Encoding.GetEncoding("gb2312"));
WebRequest 类的 Create 为静态方法,参数为要抓取的网页的网址;
Encoding 指定编码,Encoding 中有属性 ASCII、UTF32、UTF8 等全球通用的编码,但没有 gb2312 这个编码属性,所以我们使用 GetEncoding 获得 gb2312 编码。
示例
< %@ Page Language="C#" %> < %@ Import Namespace="System.Net" %> < %@ Import Namespace="System.IO" %> < !DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">< script runat="server"> void Page_Load(object sender, EventArgs e) { try { WebRequest request = WebRequest.Create("http://www.cftea.com/"); WebResponse response = request.GetResponse(); StreamReader reader = new StreamReader(response.GetResponseStream(), Encoding.GetEncoding("gb2312")); tb.Text = reader.ReadToEnd(); reader.Close(); reader.Dispose(); response.Close(); } catch (Exception ex) { tb.Text = ex.Message; } } < /script>< html xmlns="http://www.w3.org/1999/xhtml" > < head runat="server"> < title>抓取网页内容 - 千一网络< /title> < /head> < body> < form id="form1" runat="server"> < div> < asp:TextBox ID="tb" runat="server" Width="500" Height="300" TextMode="multiLine">< /asp:TextBox> < /div> < /form> < /body> < /html>
看完上述内容,你们对利用ASP.NET怎么抓取网页内容有进一步的了解吗?如果还想了解更多知识或者相关内容,请关注创新互联行业资讯频道,感谢大家的支持。