機器學習工程師面試全破解:嚴選124道AI演算法決勝題完整剖析 | 運動資訊第一站 - 2024年11月

機器學習工程師面試全破解:嚴選124道AI演算法決勝題完整剖析

作者:葫蘆娃
出版社:博碩
出版日期:2020年01月06日
ISBN:9789864344611
語言:繁體中文
售價:514元

♕ 不可不讀的機器學習面試寶典 ♕

  書中收錄了124道機器學習演算法工程師的面試題目和解答,其中絕大部分來自國際知名影音串流平台Hulu(由迪士尼所投資,總部設於美國加州)演算法研究部門的真實案例。

媒體推薦

  「由諸葛越博士所主編的此書為Hulu公司裡,十幾位每天做著頂尖機器學習工作的工程師科學家所合著,是原創的、實際的、直接可用的內容。本書致力於普及人工智慧和機器學習,幫助每位軟體工程師成為自信的AI實踐者,每位資料科學家成為出眾的AI研究者。」──沈向洋 / 微軟全球執行副總裁,美國工程院院士

  「計算機理論和演算法常常讓人感到孤高冷傲,因為它們和具體的應用之間缺少了一些橋樑。諸葛越博士的這本書,教授大家如何搭建這些橋樑。它可以讓計算機的從業者對理論的認識突飛猛進,也可以讓非計算機專業的工程人員瞭解計算機科學這個強大的工具。」──吳軍 /《浪潮之巔》《數學之美》作者

  「在越來越多的機器學習專業書籍中,Hulu工程師們的這本專著讓我眼前一亮。本書沒有拾人牙慧,從學術角度來整理機器學習的理論和演算法體系;而是從一線工程師的視角出發,在職業方向、面試重點、模型實戰和應用案例等諸方面有精闢的介紹。對每個有志進入此領域的工程師來說,本書為你鋪設了一條快速通往目標的道路。另外,本書為多位工業界實戰專家合作完成,內容卻相當連貫系統,實在難能可貴。」──劉鵬 /《計算廣告》作者,科大訊飛副總裁

編輯推薦
 
  微軟全球執行副總裁、美國工程院院士沈向洋、《浪潮之巔》《數學之美》作者吳軍、《計算廣告》作者、科大訊飛副總裁劉鵬,聯袂推薦!

  未來的幾年,是人工智慧技術全面普及化的時期,也是演算法工程師大量短缺的時期。本書旨在幫助對人工智慧和機器學習有興趣的朋友們,更加深入瞭解此領域的基本技能;幫助每個軟體工程師成為自信的AI實踐者;幫助每個資料科學家成為出眾的AI研究者。對每個有志進入此領域的工程師來說,本書會為你鋪設一條快速通往目標的道路!
 

作者簡介

葫蘆娃

  15位Hulu北京創新實驗室人才。

  他們利用擅長的機器學習、深度學習等領域知識和演算法模型,建立一套自訂化的機器AI平台,改變著推薦引擎、圖像 / 影片編解碼、內容理解、廣告投放等多項與客戶息息相關的線上業務技術。

編者簡介

諸葛越

  現任Hulu公司全球研發副總裁,中國大陸研發中心總經理。
  曾任Landscape Mobile公司聯合創始人兼CEO,前雅虎北京全球研發中心產品總監,微軟北京研發中心專案總經理,雅虎美國軟體架構師。
  諸葛越獲美國史丹佛大學的計算機碩士與博士,紐約州立大學石溪分校的應用數學碩士,曾就讀於清華大學計算機科學與技術系。
  諸葛越的研究結果獲多項專利,2005年榮獲美國計算機學會資料庫專業委員會十年最佳論文獎。
 

推薦序
前言
機器學習演算法工程師的自我修養

第1章 特徵工程 Feature Engineering
01 特徵正規化
02 類別型特徵
03 高維組合特徵的處理
04 組合特徵
05 文字表示模型
06 Word2Vec
07 圖像資料不足時的處理方法

第2章 模型評估 Evaluate Model Performance
01 評估指標的局限性
02 ROC曲線
03 餘弦距離的應用
04 A/B測試的陷阱
05 模型評估的方法
06 超參數調整與最佳化
07 過度擬合與擬合不足

第3章 經典演算法 Classical Algorithm
01 支援向量機
02 邏輯迴歸
03 決策樹

第4章 降維 Dimensionality Reduction
01 PCA最大變異數理論
02 PCA最小均方誤差理論
03 線性判別分析
04 線性判別分析與主成分分析

第5章 非監督學習 Unsupervised Learning
01 K平均群集
02 高斯混合模型
03 自組織對映神經網路
04 群集演算法的評估

第6章 機率圖模型 Probabilistic Graphical Model
01 機率圖模型的聯合機率分布
02 機率圖表示
03 生成式模型與判別式模型
04 馬可夫模型
05 主題模型

第7章 最佳化演算法 Optimization Algorithms
01 監督式學習的損失函數
02 機器學習中的最佳化問題
03 經典最佳化演算法
04 梯度驗證
05 隨機梯度下降法
06 隨機梯度下降法的加速
07 L1正則化與稀疏性

第8章 取樣 Sampling
01 取樣的作用
02 均勻分布亂數
03 常見的取樣方法
04 常態分布的取樣
05 馬可夫鏈蒙地卡羅取樣法
06 貝氏網路的取樣
07 不均衡樣本集的重取樣

第9章 前饋神經網路 Feedforward Neural Network
01 多層感知器與布林函數
02 深度神經網路中的啟動函數
03 多層感知器的反向傳播演算法
04 神經網路訓練技巧
05 深度卷積神經網路
06 深度殘差網路

第10章 遞歸神經網路 Recurrent Neutral Network
01 遞歸神經網路和卷積神經網路
02 遞歸神經網路的梯度消失問題
03 遞歸神經網路的啟動函數
04 長短期記憶網路
05 Seq2Seq模型
06 注意力機制

第11章 強化學習 Reinforcement Learning
01 強化學習基礎
02 電玩遊戲裡的強化學習
03 策略梯度
04 探索與利用

第12章 整合學習 Integrated Learning
01 整合學習的種類
02 整合學習的步驟和例子
03 基分類器
04 偏差與變異數
05 梯度提升決策樹的基本原理
06 XGBoost與GBDT的關聯和區別

第13章 生成式對抗網路 Generative Adversarial Network
01 初識GANs 的秘密
02 WGAN:抓住低維的幽靈
03 DCGAN:當GANs遇上卷積
04 ALI:包攬推論業務
05 IRGAN:產生離散樣本
06 SeqGAN:產生文字序列

第14章 人工智慧的熱門應用 Popular Applications of Artificial Intelligence
01 計算廣告
02 遊戲中的人工智慧
03 AI 在自動駕駛中的應用
04 機器翻譯
05 人機互動中的智慧計算

附錄A 作者隨筆、參考文獻

 


相關書籍