
会员
Python网络爬虫技术与应用
邓维等主编更新时间:2023-08-25 12:19:37
最新章节:参考文献开会员,本书免费读 >
网络爬虫技术的重点之一是网络爬虫框架,因此《Python网络爬虫技术与应用》结合网络爬虫框架的相关案例重点介绍网络爬虫的常见框架,包括PySpider网络爬虫框架的安装和使用,Scrapy网络爬虫框架的安装和使用,以及Scrapy网络爬虫管理与部署。另外,《Python网络爬虫技术与应用》对Python网络爬虫开发需要的reguests库、Scrapy解析库、存储库、XPath进行了介绍,并介绍了requests库、正则表达式、XPath等的使用方法,还重点讲解了这些库的实际应用。《Python网络爬虫技术与应用》以Python网络爬虫开发为主线,兼顾理论与实战,全面介绍可操作的Python环境与系统开发相关知识,以及大数据算法、大数据分析、大数据系统互补的作用。另外,《Python网络爬虫技术与应用》还赠送课程大纲、教学课件PPT、实验手册、各章习题及答案、期末试卷及答案、教学和实验视频,方便教师授课。《Python网络爬虫技术与应用》可作为高等院校大数据、计算机、电子信息、软件技术相关专业研究生和高年级本科生的教材,也可作为大数据及编程爱好者的参考用书。
品牌:清华大学
上架时间:2022-08-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
Python网络爬虫技术与应用最新章节
查看全部- 参考文献
- 本章习题
- 7.4.3 效果展示
- 7.4.2 抓取微信公众号文章的评论数据
- 7.4.1 所运用的内容讲解
- 7.4 实战案例4:微信公众号文章点赞阅读数抓取
- 7.3.3 查看效果
- 7.3.2 某研究中心的数据抓取
- 7.3.1 背景/案例知识介绍
- 7.3 实战案例3:分布式抓取
邓维等主编
主页
同类热门书
最新上架
- 会员
PHP程序设计
PHP是一种运行于服务器端并完全跨平台的嵌入式脚本编程语言,是目前开发各类Web应用的主流语言之一。本书站在初学者的角度,以通俗易懂的语言、丰富的图表、实用的案例详细介绍了PHP语言。全书共分11章:第1~7章主要介绍了Web开发概念和PHP入门、PHP基本语法、PHP流程控制和数组、PHP函数及应用、PHP与网页交互、PHP访问MySQL数据库、会话控制;第8~11章则围绕PHP进阶、PHP中的计算机14.5万字 - 会员
Java Web基础与实例教程
本书采用“任务驱动”的编写模式,由浅入深、循序渐进、系统地介绍了JavaWeb开发的相关知识。通过实际应用的案例,帮助读者巩固所学知识,以便更好地进行开发实践。全书共15章,内容涵盖了JavaWeb开发基础知识、Servlet接收GET请求数据、Servlet接收POST请求数据、Servlet生成HTTP响应数据、异步请求和异步响应、会话控制技术:Cookie与Session、过滤器Filt计算机16.7万字 - 会员
冲刺高薪Offer:Java并发编程进阶及面试指南
本书是一份旨在帮助Java求职者在面试中脱颖而出的重要指南。本书涵盖Java并发编程的多个关键主题,如并发原理和线程安全、并发关键字原理、并发锁和死锁、并发容器和工具、并发线程池以及并发设计与实战等。本书的特色在于将“大厂”“名企”的面试问题和实践经验相结合,不仅对面试问题和面试官心理进行深度剖析,还对面试问题解答和相关技术点进行详细介绍,这样更有利于读者全面理解相关知识点和技术,并能够在实际工作计算机17.6万字 - 会员
Elasticsearch实战(第2版)
本书全面深入地介绍Elasticsearch的核心功能及其工作机制。本书由浅入深,从Elasticsearch的基本用法和架构原理,以及倒排索引、分片、节点角色和相关性等核心概念讲起;然后深入探讨数据处理和索引管理,涵盖映射模式、数据类型、文本分析、索引模板;接着详细介绍词项级搜索、全文搜索、复合查询和高级搜索等Elasticsearch的搜索功能,并深入讲解聚合;最后聚焦生产环境中的Elasti计算机27.5万字 - 会员
Ascend C异构并行程序设计:昇腾算子编程指南
本书以昇腾算子编程语言AscendC的高效开发为核心,系统介绍华为面向人工智能的昇腾AI处理器架构、硬件抽象及其软件栈。本书由浅入深,通过案例讲解知识点,理论与实践并重。全书分为6章,分别介绍了昇腾AI处理器软硬件架构、AscendC快速入门、AscendC编程模型与编程范式、AscendC算子开发流程、AscendC算子调试调优和AscendC大模型算子优化。本书适合人工智能产业的研计算机9.8万字 - 会员
大模型应用开发极简入门:基于GPT-4和ChatGPT(第2版)
本书为广受读者喜爱的畅销书升级版,旨在让读者快速、简单地上手大模型应用开发。本书为初学者提供了一份清晰、全面的“最小可用知识”,带领你快速了解GPT-4和ChatGPT的工作原理及优势,并在此基础上使用流行的Python编程语言构建大模型应用。升级版在旧版的基础上进行了全面更新,融入了大模型应用开发的最新进展,比如RAG、GPT-4新特性的应用解析等。本书提供了大量简单易学的示例,帮你理解相关概念计算机13.1万字 - 会员
C语言程序设计
本书详细介绍C语言及其程序设计方法。全书共12章,主要内容包括:概述;数据类型、运算符及表达式;顺序结构程序设计;选择结构程序设计;循环结构程序设计;数组;指针;函数和变量的存储类型;结构体、公用体和枚举类型;编译预处理;位运算;文件。计算机13.7万字 - 会员
高并发系统:设计原理与实践
本书主要探讨高并发场景下系统设计的原理和实践案例,帮助读者系统、快速地理解高并发系统的设计原理与相关实践,以及掌握解决高并发场景下可能遇到的各种问题的方法。本书共6章。第1章介绍高并发系统的发展历史、设计难点和基本设计原则,以及度量指标;第2~4章介绍有助于提升高并发系统可用性的3种方法—系统容错、冗余和分片;第5章从提升高并发系统性能的角度讲解并发与异步的原理和实践技巧;第6章从系统运维和团队流计算机11.4万字 - 会员
Spring Cloud Alibaba核心技术与实战案例
本书从分布式系统的基础概念讲起,随后介绍分布式系统中间件SpringCloudAlibaba进阶实战,重点介绍了使用SpringCloudAlibaba框架整合各种分布式组件的完整过程。计算机3.1万字