
会员
网络数据采集技术:Java网络爬虫实战
钱洋等更新时间:2020-09-29 15:50:25
最新章节:9.4 本章小结开会员,本书免费读 >
本书以Java为开发语言,系统地介绍了网络爬虫的理论知识和基础工具,包括网络爬虫涉及的Java基础知识、HTTP协议基础与网络抓包、网页内容获取、网页内容解析和网络爬虫数据存储等。本书选取典型网站,采用案例讲解的方式介绍网络爬虫中涉及的问题,以增强读者的动手实践能力。同时,本书还介绍了3种Java网络爬虫开源框架,即Crawler4j、WebCollector和WebMagic。本书适用于Java网络爬虫开发的初学者和进阶者;也可作为网络爬虫课程教学的参考书,供高等院校文本挖掘、自然语言处理、大数据商务分析等相关学科的本科生和研究生参考使用;也可供企业网络爬虫开发人员参考使用。
上架时间:2020-01-01 00:00:00
出版社:电子工业出版社
上海阅文信息技术有限公司已经获得合法授权,并进行制作发行
网络数据采集技术:Java网络爬虫实战最新章节
查看全部- 9.4 本章小结
- 9.3 WebMagic的使用
- 9.2 WebCollector的使用
- 9.1 Crawler4j的使用
- 第9章 网络爬虫开源框架
- 8.9 本章小结
- 8.8 截取验证码
- 8.7 隐藏浏览器
- 8.6 动态加载JavaScript数据(操作滚动条)
- 8.5 模拟登录
钱洋等
主页
最新上架
- 会员
高并发系统:设计原理与实践
本书主要探讨高并发场景下系统设计的原理和实践案例,帮助读者系统、快速地理解高并发系统的设计原理与相关实践,以及掌握解决高并发场景下可能遇到的各种问题的方法。本书共6章。第1章介绍高并发系统的发展历史、设计难点和基本设计原则,以及度量指标;第2~4章介绍有助于提升高并发系统可用性的3种方法—系统容错、冗余和分片;第5章从提升高并发系统性能的角度讲解并发与异步的原理和实践技巧;第6章从系统运维和团队流计算机11.4万字 - 会员
Web前端开发技术:HTML、CSS、JavaScript(第3版)
本书全面介绍了Web标准的三个主要组成部分:HTML、CSS和JavaScript。循序渐进的讲述Web开发所涉及的三大前端技术的内容、应用技巧以及它们的综合应用。每部分都配置了大量的实用案例,图文并茂,效果直观。全书共21章,分为四个部分。在HTML部分,系统介绍了主要讲述了主要讲述了HTML基本概念、常用文本标签、文档结构标签、在网页中插入多媒体内容、列表、DIV标签、元素类型、在网页中创建超计算机13.2万字 - 会员
Go语言高效编程:原理、可观测性与优化
虽然技术在进步,硬件也越来越物美价廉,但如今软件工程师仍需要关注程序的性能优化。本书将介绍软件效率问题、Go语言快速入门知识、如何实现高效编程,告诉大家如何高效进行性能优化,以及何时进行,并给出需要的工具和相关知识,让你使用较少的资源实现高效编程。计算机27.3万字 - 会员
C++趣味编程及算法入门
本书讲解了C++语言基础知识,以及编程解题常用的方法和基础算法。每章都是由一个小故事来引出编程思维。本书也介绍了各种有趣的计算机知识,并涵盖了全国青少年软件编程等级考试(C语言)一级和二级考试的知识点。计算机13.4万字 - 会员
大模型应用开发极简入门:基于GPT-4和ChatGPT(第2版)
本书为广受读者喜爱的畅销书升级版,旨在让读者快速、简单地上手大模型应用开发。本书为初学者提供了一份清晰、全面的“最小可用知识”,带领你快速了解GPT-4和ChatGPT的工作原理及优势,并在此基础上使用流行的Python编程语言构建大模型应用。升级版在旧版的基础上进行了全面更新,融入了大模型应用开发的最新进展,比如RAG、GPT-4新特性的应用解析等。本书提供了大量简单易学的示例,帮你理解相关概念计算机13.1万字 - 会员
C语言程序设计
本书详细介绍C语言及其程序设计方法。全书共12章,主要内容包括:概述;数据类型、运算符及表达式;顺序结构程序设计;选择结构程序设计;循环结构程序设计;数组;指针;函数和变量的存储类型;结构体、公用体和枚举类型;编译预处理;位运算;文件。计算机13.7万字 - 会员
Ascend C异构并行程序设计:昇腾算子编程指南
本书以昇腾算子编程语言AscendC的高效开发为核心,系统介绍华为面向人工智能的昇腾AI处理器架构、硬件抽象及其软件栈。本书由浅入深,通过案例讲解知识点,理论与实践并重。全书分为6章,分别介绍了昇腾AI处理器软硬件架构、AscendC快速入门、AscendC编程模型与编程范式、AscendC算子开发流程、AscendC算子调试调优和AscendC大模型算子优化。本书适合人工智能产业的研计算机9.8万字 - 会员
Java程序设计实战教程
本书从Java初学者的角度出发,用通俗易懂的语言、贴近实际生活的实例,详细地介绍使用Java语言进行程序开发须掌握的知识和技术,帮助读者快速掌握Java程序开发的技能。全书共14章,分别为Java程序设计入门、Java语言基础、流程控制、方法与数组、面向对象基础、深入面向对象、常用类、异常、集合类、File与I/O流、多线程、图形用户界面、网络编程、反射。随书电子资源中还提供了综合项目实训,以巩固计算机17万字 - 会员
码上行动:用ChatGPT学会Python编程
本书共15章,第1章讲解了ChatGPT的功能及在编程学习中的作用;第2章讲解了Python的语言特点及开发环境的搭建;第3-10章讲解了Python的语言基础,包括输入与输出、变量与类型、运算、控制流、函数、列表、字典、模块;第11-13章介绍了使用Python进行文件操作、网络爬虫的相关操作,以及面向对象程序设计;第14-15章介绍了ChatGPT工具在编程中的应用,包括利用它进行辅助开发和在计算机14.6万字
同类书籍最近更新
- 会员
大模型应用开发极简入门:基于GPT-4和ChatGPT(第2版)
本书为广受读者喜爱的畅销书升级版,旨在让读者快速、简单地上手大模型应用开发。本书为初学者提供了一份清晰、全面的“最小可用知识”,带领你快速了解GPT-4和ChatGPT的工作原理及优势,并在此基础上使用流行的Python编程语言构建大模型应用。升级版在旧版的基础上进行了全面更新,融入了大模型应用开发的最新进展,比如RAG、GPT-4新特性的应用解析等。本书提供了大量简单易学的示例,帮你理解相关概念程序设计13.1万字 - 会员
Go语言高效编程:原理、可观测性与优化
虽然技术在进步,硬件也越来越物美价廉,但如今软件工程师仍需要关注程序的性能优化。本书将介绍软件效率问题、Go语言快速入门知识、如何实现高效编程,告诉大家如何高效进行性能优化,以及何时进行,并给出需要的工具和相关知识,让你使用较少的资源实现高效编程。程序设计27.3万字 - 会员
Three.js权威指南:在网页上创建3D图形和动画的方法与实践(原书第4版)
Three.js在过去几年中已经成为创建令人惊叹的3DWebGL内容的标准方式。本书探讨Three.js的所有特性,并提供额外的内容,包括如何将Three.js与Blender、React、TypeScript以及最新的物理引擎进行集成。本书共分为四个部分:第一部分介绍搭建开发环境和运行Three.js;第二部分介绍Three.js的核心组件;第三部分介绍如何创建复杂的几何体、动画和纹理;第四部程序设计13.3万字