新書推薦:

《
东线有战事1914:一战爆发与帝国崩溃
》
售價:NT$
449.0

《
奇岩馆事件(“这本推理小说了不起!”大奖获奖作者高野结史颠覆你的推理常识)
》
售價:NT$
254.0

《
暗斗:一个书生的文化抗战
》
售價:NT$
449.0

《
西周人的日常生活:中国贵族的蜕变之旅 西周人的一天 九鼎八簋的隐藏菜单
》
售價:NT$
500.0

《
近代中国政府与政治
》
售價:NT$
551.0

《
索恩丛书·蛮族之王:狄奥多里克与罗马帝国的黄昏
》
售價:NT$
811.0

《
世界银行营商环境成熟度方法论手册 2025年修订版 官方指导手册
》
售價:NT$
1520.0

《
人形机器人:产业变革商业机遇与未来趋势
》
售價:NT$
449.0
|
內容簡介: |
運用各種資料分析套件和統計模型,解決大數據時代所會遇到的各種難題
R語言是公認處理大數據的最佳利器,不只免費、語法簡單、直覺,還具備數千個功能強大的延伸套件,更讓R語言深入各種不同的應用領域。本書由國際知名的資料分析專家執筆,作者具備豐富的R語言教學經驗,從中篩選出R的基本功能和最新、最好用的套件,並以各種資料集案例,具體展現資料分析成果。
對於有心跨足資料科學、數據分析、量化交易、人工智慧、機器學習等領域的讀者,只會R語言的語法自然是不夠的。我們將帶您運用各種資料分析套件和統計模型,解決大數據時代所會遇到的各種難題,包括:向量運算、文字探勘、資料視覺化、趨勢預測、資料建模,以及各種分析結果的輸出、引用與動態呈現等,全面掌握R語言的各種技巧。
本書特色:
●向量運算:全向量化的資料結構,包括:vector、factorvector、data.frame、list、matrix、array等
●文字探勘:各類資料匯入讀取、抽取字串、表格轉換與合併、資料聚合、資料正規化、網路爬蟲
●資料視覺化:最吸睛的ggplot2套件圖表繪製技巧,並利用Shiny套件產生網頁互動展示儀表板
●機率統計:快速領略統計學核心應用,抽樣分佈、假設檢定、變異數分析、資料分群
●趨勢預測:展現大數據威力的強力工具,線性迴歸、廣義線性模型、非線性模型、時間序列與自相關性
●資料建模:機器學習的基礎,利用Caret評斷資料模型配適度,建立資料測試與訓練機制,透過交叉驗證和參數挑選建立最佳模式
●進階應用:資料分析師必學的套件包裝與發佈、報表投影片製作、制式化文件輸出等
|
關於作者: |
JaredP.Lander
其專長為資料管理、多階層模型、機器學習、廣義線性模型、視覺化圖表與統計計算,目前是LanderAnalytics的創始人兼行政總裁,該公司是紐約市的企管顧問公司。作者也是紐約市開源碼大會的主辦人,且是哥倫比亞大學統計系兼任教授。
JaredP.Lander在哥倫比亞大學取得統計碩士,也曾在許多不同的機構任職過,包括關於政治、科技、籌款、音樂、金融、健保和人道救援的工作,在學術研究和業界皆有豐富經驗。
|
目錄:
|
01R語言的下載與安裝
02R的操作環境簡介
03R語言的套件
04R語言基礎
05進階資料結構
06讀取各類資料
07統計繪圖
08建立R函數
09流程控制
10迴圈—迭代元素的傳統作法
11群組資料操作
12更有效率的群組操作–使用dplyr
13使用purrr迭代的做法
14資料整理
15Tidyverse下的資料整理
16字串處理
17機率分佈
18基本統計分析
19線性模型
20廣義線性模型
21模型診斷
22正規化和壓縮方法
23非線性模型
24時間序列與自相關性
25資料分群
26模型配適-使用Caret套件
27用Knitr套件將分析結果轉製成報表
28用Rmarkdown製作富文本
29用Shinny套件建立互動資訊看板
30章建立R套件
附錄AR語言參考資源
附錄B名詞解釋
|
|