在好例子网,分享、交流、成长!
您当前所在位置:首页C# 开发实例Windows系统编程 → C#百度指数抓取方法(2012年版本,已失效 学习思路即可)

C#百度指数抓取方法(2012年版本,已失效 学习思路即可)

Windows系统编程

下载此实例
  • 开发语言:C#
  • 实例大小:0.09M
  • 下载次数:15
  • 浏览次数:394
  • 发布时间:2015-07-26
  • 实例类别:Windows系统编程
  • 发 布 人:女王
  • 文件格式:.zip
  • 所需积分:2
 相关标签: C# 百度 c

实例介绍

【实例简介】C#监听webBrowser包来抓取到百度指数

【实例截图】
【核心代码】

using System;
using System.Collections.Generic;
using System.ComponentModel;
using System.Data;
using System.Drawing;
using System.Linq;
using System.Text;
using System.Text.RegularExpressions;
using System.Windows.Forms;
using System.Net.Sockets;
using System.Net;
using System.IO;
using System.Runtime.Serialization.Formatters;
using System.Runtime.Serialization.Formatters.Binary;
using System.Threading;

namespace test
{
    /// <summary>
    /// 
    /// </summary>
    public partial class Form1 : Form
    {
        public Form1()
        {
            InitializeComponent();
        }

        //定义一个webBrowser对象用来查询百度信息
        System.Windows.Forms.WebBrowser webBrowser1 = new WebBrowser();

        //在加载时处理数据
        private void Form1_Load(object sender, EventArgs e)
        {
            //加载本机的所有IP地址
            IPAddress[] ips = Dns.GetHostAddresses(Dns.GetHostName());
            foreach (IPAddress ipad in ips)
            {
                comboBox1.Items.Add(ipad.ToString());
            }

            #region 初始化webBrowser1

            webBrowser1.Location = new System.Drawing.Point(5, 38);
            webBrowser1.MinimumSize = new System.Drawing.Size(20, 20);
            webBrowser1.Name = "webBrowser1";
            webBrowser1.Size = new System.Drawing.Size(855, 279);
            webBrowser1.TabIndex = 5;

            #endregion
        }
        Boolean F = true;
        private void button1_Click(object sender, EventArgs e)
        {
            //清空当前数据
            richTextBox1.Text = "";

            //存数据的变量
            string userIndexes = "";

            //是否开始捕获数据
            F = true;

            //开始查询百度信息
            webBrowser1.Navigate("http://index.baidu.com/main/word.php?word="   textBox1.Text.Trim());

            //创建一个Socket对象
            Socket s = new Socket(System.Net.Sockets.AddressFamily.InterNetwork, System.Net.Sockets.SocketType.Raw, System.Net.Sockets.ProtocolType.IP);

            //绑定IP到Socket
            s.Bind(new System.Net.IPEndPoint(IPAddress.Parse(comboBox1.Text), 0));

            //为当前数据报提供标头
            s.SetSocketOption(System.Net.Sockets.SocketOptionLevel.IP, System.Net.Sockets.SocketOptionName.HeaderIncluded, 1);

            //检查电脑所有端口
            s.IOControl(unchecked((int)0x98000001), new byte[4] { 1, 0, 0, 0 }, new byte[4]);

            //下面的线程只执行8秒,8秒后就不再执行了。
            timer1.Enabled = true;

            //开始一个新的线程,查询数据
            Thread th = new Thread(delegate()
            {
                try
                {
                    //确定端口 让端口唯一是为了防止多个用户同时查询时的串数据
                    string port = "";

                    //是否开始抓包
                    while (F)
                    {
                        //获取从网络中得到的数据,看是否有可读的数据
                        if (s.Available > 0)
                        {
                            //计算机所有端口
                            byte[] bs = new byte[65536];

                            //将接受到的数据存储的缓冲共里面
                            s.Receive(bs);
                            //创建一个IPIPPacket
                            IPPacket ip = new IPPacket(ref bs);

                            //只有当接发送方使用TCP协议,并且源IP为180.149.131.33时才执行
                            if (ip.TCP != null && ip.SourceAddress.ToString().Trim() == Dns.GetHostByName("index.baidu.com").AddressList[0].ToString().Trim())
                            {
                                //将缓冲区中的数据以指定格式进行筛选,并把结果存储到Data中
                                string Data = System.Text.RegularExpressions.Regex.Replace(System.Text.Encoding.ASCII.GetString(ip.TCP.PacketData),
                                    @"[^a-zA-Z_0-9\.\@\- ]", "");

                                //开始一次取数据时的报文端口号
                                if (Data.Contains("userIndexes"))
                                {
                                    port = ip.TCP.DestinationPort.ToString().Trim();
                                }

                                //一次存储取出的数据
                                userIndexes  = Data;

                                //当出现mediaIndexes时结束捕获
                                if (Data.Contains("mediaIndexes") && (port == "" || port == ip.TCP.DestinationPort.ToString().Trim()))
                                {
                                    //不在捕获的标志
                                    F = false;

                                    //关闭当前Socket
                                    s.Close();

                                    //取出userIndexes之后的数据
                                    userIndexes = userIndexes.Substring(userIndexes.IndexOf("userIndexes"));

                                    //取出mediaIndexes之前的数据
                                    userIndexes = userIndexes.Substring(0, userIndexes.IndexOf("mediaIndexes")   12);
                                }

                                //取当前流的端口
                                port = ip.TCP.DestinationPort.ToString().Trim();
                            }
                        }
                    }

                    //把最终取出的数据放入richTextBox1中去
                    if (userIndexes.Contains("mediaIndexes"))
                        richTextBox1.Text = userIndexes;
                    else
                        richTextBox1.Text = "数据不存在";
                }
                catch (Exception ex)
                {
                    F = false;
                    richTextBox1.Text = ex.Message.Trim();
                }
            });
            th.Start();
        }

        //在关闭窗体前结束进程
        private void Form1_FormClosing(object sender, FormClosingEventArgs e)
        {
            Application.Exit();
        }

        private void Form1_FormClosed(object sender, FormClosedEventArgs e)
        {
            Application.Exit();
        }

        private void timer1_Tick(object sender, EventArgs e)
        {
            F = false;
        }
    }
}

标签: C# 百度 c

实例下载地址

C#百度指数抓取方法(2012年版本,已失效 学习思路即可)

不能下载?内容有错? 点击这里报错 + 投诉 + 提问

好例子网口号:伸出你的我的手 — 分享

网友评论

发表评论

(您的评论需要经过审核才能显示)

查看所有0条评论>>

小贴士

感谢您为本站写下的评论,您的评论对其它用户来说具有重要的参考价值,所以请认真填写。

  • 类似“顶”、“沙发”之类没有营养的文字,对勤劳贡献的楼主来说是令人沮丧的反馈信息。
  • 相信您也不想看到一排文字/表情墙,所以请不要反馈意义不大的重复字符,也请尽量不要纯表情的回复。
  • 提问之前请再仔细看一遍楼主的说明,或许是您遗漏了。
  • 请勿到处挖坑绊人、招贴广告。既占空间让人厌烦,又没人会搭理,于人于己都无利。

关于好例子网

本站旨在为广大IT学习爱好者提供一个非营利性互相学习交流分享平台。本站所有资源都可以被免费获取学习研究。本站资源来自网友分享,对搜索内容的合法性不具有预见性、识别性、控制性,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,平台无法对用户传输的作品、信息、内容的权属或合法性、安全性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论平台是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二与二十三条之规定,若资源存在侵权或相关问题请联系本站客服人员,点此联系我们。关于更多版权及免责申明参见 版权及免责申明

;
报警