在好例子网,分享、交流、成长!
您当前所在位置:首页C# 开发实例Windows系统编程 → C#百度指数抓取方法(2012年版本,已失效 学习思路即可)

C#百度指数抓取方法(2012年版本,已失效 学习思路即可)

Windows系统编程

下载此实例
  • 开发语言:C#
  • 实例大小:0.09M
  • 下载次数:15
  • 浏览次数:413
  • 发布时间:2015-07-26
  • 实例类别:Windows系统编程
  • 发 布 人:女王
  • 文件格式:.zip
  • 所需积分:2
 相关标签: C# 百度 c

实例介绍

【实例简介】C#监听webBrowser包来抓取到百度指数

【实例截图】
【核心代码】

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
using System;
using System.Collections.Generic;
using System.ComponentModel;
using System.Data;
using System.Drawing;
using System.Linq;
using System.Text;
using System.Text.RegularExpressions;
using System.Windows.Forms;
using System.Net.Sockets;
using System.Net;
using System.IO;
using System.Runtime.Serialization.Formatters;
using System.Runtime.Serialization.Formatters.Binary;
using System.Threading;
 
namespace test
{
    /// <summary>
    ///
    /// </summary>
    public partial class Form1 : Form
    {
        public Form1()
        {
            InitializeComponent();
        }
 
        //定义一个webBrowser对象用来查询百度信息
        System.Windows.Forms.WebBrowser webBrowser1 = new WebBrowser();
 
        //在加载时处理数据
        private void Form1_Load(object sender, EventArgs e)
        {
            //加载本机的所有IP地址
            IPAddress[] ips = Dns.GetHostAddresses(Dns.GetHostName());
            foreach (IPAddress ipad in ips)
            {
                comboBox1.Items.Add(ipad.ToString());
            }
 
            #region 初始化webBrowser1
 
            webBrowser1.Location = new System.Drawing.Point(5, 38);
            webBrowser1.MinimumSize = new System.Drawing.Size(20, 20);
            webBrowser1.Name = "webBrowser1";
            webBrowser1.Size = new System.Drawing.Size(855, 279);
            webBrowser1.TabIndex = 5;
 
            #endregion
        }
        Boolean F = true;
        private void button1_Click(object sender, EventArgs e)
        {
            //清空当前数据
            richTextBox1.Text = "";
 
            //存数据的变量
            string userIndexes = "";
 
            //是否开始捕获数据
            F = true;
 
            //开始查询百度信息
            webBrowser1.Navigate("http://index.baidu.com/main/word.php?word="   textBox1.Text.Trim());
 
            //创建一个Socket对象
            Socket s = new Socket(System.Net.Sockets.AddressFamily.InterNetwork, System.Net.Sockets.SocketType.Raw, System.Net.Sockets.ProtocolType.IP);
 
            //绑定IP到Socket
            s.Bind(new System.Net.IPEndPoint(IPAddress.Parse(comboBox1.Text), 0));
 
            //为当前数据报提供标头
            s.SetSocketOption(System.Net.Sockets.SocketOptionLevel.IP, System.Net.Sockets.SocketOptionName.HeaderIncluded, 1);
 
            //检查电脑所有端口
            s.IOControl(unchecked((int)0x98000001), new byte[4] { 1, 0, 0, 0 }, new byte[4]);
 
            //下面的线程只执行8秒,8秒后就不再执行了。
            timer1.Enabled = true;
 
            //开始一个新的线程,查询数据
            Thread th = new Thread(delegate()
            {
                try
                {
                    //确定端口 让端口唯一是为了防止多个用户同时查询时的串数据
                    string port = "";
 
                    //是否开始抓包
                    while (F)
                    {
                        //获取从网络中得到的数据,看是否有可读的数据
                        if (s.Available > 0)
                        {
                            //计算机所有端口
                            byte[] bs = new byte[65536];
 
                            //将接受到的数据存储的缓冲共里面
                            s.Receive(bs);
                            //创建一个IPIPPacket
                            IPPacket ip = new IPPacket(ref bs);
 
                            //只有当接发送方使用TCP协议,并且源IP为180.149.131.33时才执行
                            if (ip.TCP != null && ip.SourceAddress.ToString().Trim() == Dns.GetHostByName("index.baidu.com").AddressList[0].ToString().Trim())
                            {
                                //将缓冲区中的数据以指定格式进行筛选,并把结果存储到Data中
                                string Data = System.Text.RegularExpressions.Regex.Replace(System.Text.Encoding.ASCII.GetString(ip.TCP.PacketData),
                                    @"[^a-zA-Z_0-9\.\@\- ]", "");
 
                                //开始一次取数据时的报文端口号
                                if (Data.Contains("userIndexes"))
                                {
                                    port = ip.TCP.DestinationPort.ToString().Trim();
                                }
 
                                //一次存储取出的数据
                                userIndexes  = Data;
 
                                //当出现mediaIndexes时结束捕获
                                if (Data.Contains("mediaIndexes") && (port == "" || port == ip.TCP.DestinationPort.ToString().Trim()))
                                {
                                    //不在捕获的标志
                                    F = false;
 
                                    //关闭当前Socket
                                    s.Close();
 
                                    //取出userIndexes之后的数据
                                    userIndexes = userIndexes.Substring(userIndexes.IndexOf("userIndexes"));
 
                                    //取出mediaIndexes之前的数据
                                    userIndexes = userIndexes.Substring(0, userIndexes.IndexOf("mediaIndexes")   12);
                                }
 
                                //取当前流的端口
                                port = ip.TCP.DestinationPort.ToString().Trim();
                            }
                        }
                    }
 
                    //把最终取出的数据放入richTextBox1中去
                    if (userIndexes.Contains("mediaIndexes"))
                        richTextBox1.Text = userIndexes;
                    else
                        richTextBox1.Text = "数据不存在";
                }
                catch (Exception ex)
                {
                    F = false;
                    richTextBox1.Text = ex.Message.Trim();
                }
            });
            th.Start();
        }
 
        //在关闭窗体前结束进程
        private void Form1_FormClosing(object sender, FormClosingEventArgs e)
        {
            Application.Exit();
        }
 
        private void Form1_FormClosed(object sender, FormClosedEventArgs e)
        {
            Application.Exit();
        }
 
        private void timer1_Tick(object sender, EventArgs e)
        {
            F = false;
        }
    }
}

标签: C# 百度 c

实例下载地址

C#百度指数抓取方法(2012年版本,已失效 学习思路即可)

不能下载?内容有错? 点击这里报错 + 投诉 + 提问

好例子网口号:伸出你的我的手 — 分享

网友评论

发表评论

(您的评论需要经过审核才能显示)

查看所有0条评论>>

小贴士

感谢您为本站写下的评论,您的评论对其它用户来说具有重要的参考价值,所以请认真填写。

  • 类似“顶”、“沙发”之类没有营养的文字,对勤劳贡献的楼主来说是令人沮丧的反馈信息。
  • 相信您也不想看到一排文字/表情墙,所以请不要反馈意义不大的重复字符,也请尽量不要纯表情的回复。
  • 提问之前请再仔细看一遍楼主的说明,或许是您遗漏了。
  • 请勿到处挖坑绊人、招贴广告。既占空间让人厌烦,又没人会搭理,于人于己都无利。

关于好例子网

本站旨在为广大IT学习爱好者提供一个非营利性互相学习交流分享平台。本站所有资源都可以被免费获取学习研究。本站资源来自网友分享,对搜索内容的合法性不具有预见性、识别性、控制性,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,平台无法对用户传输的作品、信息、内容的权属或合法性、安全性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论平台是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二与二十三条之规定,若资源存在侵权或相关问题请联系本站客服人员,点此联系我们。关于更多版权及免责申明参见 版权及免责申明

;
报警