新書推薦:

《
大学问·市镇内外:晚明江南的地域结构与社会变迁(以地方权势阶层为切入点,剖析市镇兴衰与社会秩序变迁,为江南市镇研究开辟全新视角。)
》
售價:NT$
398.0

《
王朝的赌局:宋徽宗联金灭辽的致命抉择
》
售價:NT$
398.0

《
盔甲骑士:为自己出征(纪念版)
》
售價:NT$
254.0

《
地图中的战争史.海战篇(世界知名历史学家杰里米·布莱克口碑之作!)
》
售價:NT$
755.0

《
预见6G
》
售價:NT$
449.0

《
全球视野下的投资机会
》
售價:NT$
449.0

《
地图中的战争史.陆战篇(一本书看透军事地图对500余年来近现代世界的塑造)
》
售價:NT$
857.0

《
我们的箱根驿传
》
售價:NT$
332.0
|
內容簡介: |
【大數據時代必備的資料擷取與分析技能!】
在資訊爆炸的時代,網路就是一個龐大的資源庫,不論是「想找出最便宜的商品價格」、「想知道競爭者的商品資訊」、「分析時下流行的趨勢」、「想了解歷史股價」、「分析球員的打擊率、得分率」、「分析點閱率最高的影片做為行銷決策」、……等等,都可以輕易取得各種數據。
雖然數據來源不是問題,但要抓取、整理、分析龐大的資料,就需要一些工具及方法才能有效率地完成。本書實際教您使用Python的BeautifulSoup、Pandas、Selenium及Scrapy來建立爬蟲程式,並依不同的網頁型態使用對應的工具來抓取資料。在取得和儲存資料後,教您利用Python的Matplotlib、Pandas、SeaBorn、Bokeh,將資料以視覺化的方式呈現,讓決策者能快速理解資料的【模式】、【趨勢】和【關聯性】。
本書特色:
※從網路爬蟲→資料清理→資料視覺化,有效率地完成資料的探索及呈現。
※清楚解說Python各套件的使用時機
.【擷取靜態網頁資料】-CSS選擇器+BeautifulSoup及lxml
.【擷取Javascript動態網頁資料】-Selenium
.【擷取整個網站資料】-Scrapy框架
.【資料視覺化】-Matplotlib、Pandas、Seaborn、Bokeh
※列舉多項實例,讓您應用所學,實際擷取資料
.用BeautifulSoup爬取股價、電影、圖書等資訊
.用Selenium爬取旅館、食譜資訊
.用Scrapy爬取Tutsplus教學文件及PTT看板資訊
|
目錄:
|
【Part1建立Python爬蟲程式-從網頁取得資料】
CHAPTER1HTML、JSON與網路爬蟲的基礎
CHAPTER2從網路取得資料
CHAPTER3擷取靜態HTML網頁資料
CHAPTER4使用CSS選擇器爬取資料
CHAPTER5走訪HTML網頁取出資料與資料儲存
CHAPTER6使用XPath運算式與lxml套件建立爬蟲程式
CHAPTER7Selenium表單互動與動態網頁擷取
CHAPTER8Scrapy爬蟲框架
CHAPTER9Python爬蟲程式實作案例
CHAPTER10將爬取資料存入MySQL資料庫
【Part2Python資料視覺化-大數據分析】
CHAPTER11認識大數據分析-資料視覺化
CHAPTER12使用Pandas掌握你的資料
CHAPTER13Matplotlib與Pandas資料視覺化
CHAPTER14Seaborn統計資料視覺化
CHAPTER15Bokeh互動圖表與儀表板
CHAPTER16Python資料視覺化實作案例
附錄APython程式語言與開發環境建立
|
|