在好例子网,分享、交流、成长!
您当前所在位置:首页Java 开发实例文件解析和处理 → jsoup采集必应壁纸 示例源码

jsoup采集必应壁纸 示例源码

文件解析和处理

下载此实例
  • 开发语言:Java
  • 实例大小:0.02M
  • 下载次数:10
  • 浏览次数:236
  • 发布时间:2019-03-23
  • 实例类别:文件解析和处理
  • 发 布 人:crazycode
  • 文件格式:.zip
  • 所需积分:2
 相关标签: 采集 壁纸 js 源码 jsoup

实例介绍

【实例简介】采集地址为 https://bing.ioliu.cn/

【实例截图】

from clipboard


采集后的结果在这里

from clipboard


【核心代码】

import org.jsoup.Connection;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

import javax.net.ssl.*;
import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.net.URL;
import java.net.URLConnection;
import java.security.SecureRandom;
import java.security.cert.X509Certificate;
import java.util.*;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;

public class Main {

    public static String myURL = "https://bing.ioliu.cn/";
    public static String filePath = "D:\\bingPicture\\";

    // 安全证书 信任所有站点
    public static InputStream getByDisableCertValidation(String url) {
        System.out.println("正在获取网站安全证书,请稍等....");
        TrustManager[] trustAllCerts = new TrustManager[]{new X509TrustManager() {
            public X509Certificate[] getAcceptedIssuers() {
                return new X509Certificate[0];
            }

            public void checkClientTrusted(X509Certificate[] certs, String authType) {
            }

            public void checkServerTrusted(X509Certificate[] certs, String authType) {
            }
        }};

        HostnameVerifier hv = new HostnameVerifier() {
            public boolean verify(String hostname, SSLSession session) {
                return true;
            }
        };

        try {
            SSLContext sc = SSLContext.getInstance("SSL");
            sc.init(null, trustAllCerts, new SecureRandom());
            HttpsURLConnection.setDefaultSSLSocketFactory(sc.getSocketFactory());
            HttpsURLConnection.setDefaultHostnameVerifier(hv);

            URL uRL = new URL(url);
            HttpsURLConnection urlConnection = (HttpsURLConnection) uRL.openConnection();
            InputStream is = urlConnection.getInputStream();
            return is;
        } catch (Exception e) {
        }
        return null;
    }

    // 输出流
    public static void readInputStream(InputStream inStream, String path)
            throws Exception {
        File file = new File(path);
        FileOutputStream fos = new FileOutputStream(file);
        byte[] buffer = new byte[102400];
        int len = 0;
        while ((len = inStream.read(buffer)) != -1) {
            fos.write(buffer, 0, len);
        }
        inStream.close();
        fos.flush();
        fos.close();
    }

    // 文件夹是否存在
    public boolean fileIfExists(String path){
        File f=new File(path);
        if(f.exists()){
            return true;
        }else{
            f.mkdir();
            return false;
        }
    }

    // 请求页面
    public Connection getCollection(String url) {
        getByDisableCertValidation(url);
        Connection conn = null;
        Map<String, String> map = new HashMap<>();
        map.put("Accept", "text/html,application/xhtml xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8");
        map.put("Accept-Encoding", "gzip, deflate, br");
        map.put("Referer", "https://bing.ioliu.cn/ranking");
        conn = Jsoup.connect(url)
                .userAgent("Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36") // http请求的浏览器设置
                .timeout(5000)   // http连接时长
                .headers(map)
                .method(Connection.Method.POST);
        // 请求类型是get请求,http请求还是post,delete等方式
        return conn;
    }

    public static void main(String[] args) {
        Scanner s = new Scanner(System.in);
        System.out.println("请输入页数:");
        int pageNum = s.nextInt();
        Main main = new Main();
        Connection conn = main.getCollection(myURL   "?p="   pageNum);
        Document doc = null;
        try {
            doc = conn.get();
        } catch (IOException e1) {
            System.out.println("在连接官网时报错。。");
        }
        if (!main.fileIfExists(filePath)) {
            System.out.println("文件夹不存在,创建了一个指定目录的文件夹...");
        }
        Element body = doc.body();
        Elements lis = body.getElementsByClass("progressive__img progressive--not-loaded");
        final Map<String, String> urlMap = new HashMap<>();

        int i = 0;
        for (Element a : lis) {
            urlMap.put("url"   i, a.attr("data-progressive").replace("800x480", "1920x1080"));
            i  ;
        }
        ExecutorService pool = Executors.newCachedThreadPool(); //创建一个可缓存线程池,如果线程池长度超过处理需要,可灵活回收空闲线程,若无可回收,则新建线程。
        for (int j = 0; j < urlMap.size(); j  ) {
            final int finalJ = j;
            Runnable run = new Runnable() { // 使用多线程
                public void run() {
                    String imgUrl = urlMap.get("url"   finalJ).toString();
                    try {
                        URL url = new URL(imgUrl);
                        URLConnection con = url.openConnection();
                        con.setConnectTimeout(5000);
                        con.setRequestProperty("User-Agent", "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36");
                        InputStream inStream = con.getInputStream();
                        readInputStream(inStream, filePath   System.currentTimeMillis()   ".jpg");
                        System.out.println(imgUrl   "  下载成功");
                    } catch (Exception e) {
                        System.out.println(imgUrl   "  下载失败!!!");
                    }
                }
            };
            pool.execute(run);
        }
        pool.shutdown();


    }
}

实例下载地址

jsoup采集必应壁纸 示例源码

不能下载?内容有错? 点击这里报错 + 投诉 + 提问

好例子网口号:伸出你的我的手 — 分享

网友评论

发表评论

(您的评论需要经过审核才能显示)

查看所有0条评论>>

小贴士

感谢您为本站写下的评论,您的评论对其它用户来说具有重要的参考价值,所以请认真填写。

  • 类似“顶”、“沙发”之类没有营养的文字,对勤劳贡献的楼主来说是令人沮丧的反馈信息。
  • 相信您也不想看到一排文字/表情墙,所以请不要反馈意义不大的重复字符,也请尽量不要纯表情的回复。
  • 提问之前请再仔细看一遍楼主的说明,或许是您遗漏了。
  • 请勿到处挖坑绊人、招贴广告。既占空间让人厌烦,又没人会搭理,于人于己都无利。

关于好例子网

本站旨在为广大IT学习爱好者提供一个非营利性互相学习交流分享平台。本站所有资源都可以被免费获取学习研究。本站资源来自网友分享,对搜索内容的合法性不具有预见性、识别性、控制性,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,平台无法对用户传输的作品、信息、内容的权属或合法性、安全性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论平台是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二与二十三条之规定,若资源存在侵权或相关问题请联系本站客服人员,点此联系我们。关于更多版权及免责申明参见 版权及免责申明

;
报警