網頁排名PR值及其他--搜索引擎排序的科學 | 運動資訊第一站 - 2024年11月
網頁排名PR值及其他--搜索引擎排序的科學
首部關於網頁排名科學的著作,是搜索排序姊妹篇的一本。本書主要內容有:網絡搜索引擎簡介、網絡爬行、索引建立和查詢處理、通過歡迎度對網頁排名、PageRank的數學、PageRank模型中的參數、PageRank的敏感性、作為線性系統的PageRank問題、PageRank大規模實現中的問題、加速PageRank計算、更新PageRank向量、HITS網頁排名方法、網頁排名的其他鏈接方法、網絡信息檢索的未來、網絡信息檢索資源、數學指南、術語匯編、參考文獻、索引。本書可作為數學、計算機、網絡技術、管理學和數據科學等專業領域科研人員和工程技術人員的參考書,也可作為教材使用。
前言第1章 網絡搜索引擎簡介 1.1 信息檢索簡史 1.2 傳統信息檢索回顧 1.3 網絡信息檢索第2章 網絡爬行、索引建立和查詢處理 2.1 網絡爬行 2.2 內容索引 2.3 查詢處理第3章 通過歡迎度對網頁排名 3.1 1998年的情景 3.2 兩篇論文 3.3 查詢無關性第4章 谷歌PageRank的數學 4.1 PageRank的原始求和公式 4.2 求和方程的矩陣表示 4.3 迭代過程問題 4.4 一點關於馬爾可夫鏈理論的介紹 4.5 基本模型的早期修正 4.6 PageRank向量的計算 4.7 谷歌矩陣的譜定理及其證明第5章 PageRank模型中的參數 5.1 α因子 5.2 超鏈接矩陣H 5.3 跳轉矩陣E第6章 PageRank的敏感性 6.1 對α的敏感性 6.2 對H的敏感性 6.3 對vT的敏感性 6.4 其他敏感性分析 6.5 有關敏感性的定理和證明第7章 作為線性系統的PageRank問題 7.1 (I-αS)的性質 7.2 (I-αH)的性質 7.3 PageRank稀疏線性系統的證明第8章 PageRank大規模實現中的問題 8.1 存儲問題 8.2 收斂准則 8.3 精度 8.4 懸掛結點 8.5 對后退按鈕建模第9章 加速PageRank計算 9.1 一種自適應的冪法 9.2 外插 9.3 聚合 9.4 其他數值方法第10章 更新PageRank向量 10.1 兩類更新問題及其發展歷程 10.2 重啟冪法 10.3 使用近似聚合進行近似更新 10.4 精確聚合 10.5 精確聚合與近似聚合的比較 10.6 利用迭代聚合進行更新 10.7 確定划分 10.8 結論第11章 HITS網頁排名方法 11.1 HITS算法 11.2 HITS的實現 11.3 HITS的收斂性 11.4 HITS示例 11.5 HITS的優點與缺點 11.6 HITS與文獻統計學的關系 11.7 查詢無關HITS 11.8 加HITS 11.9 HITS的敏感性第12章 網頁排名的其他鏈接方法 12.1 SALSA 12.2 混成排名方法 12.3 基於流量的排名第13章 網絡信息檢索的未來 13.1 垃圾信息 13.2 個性化 13.3 聚類 13.4 智能體 13.5 趨勢與時間敏感搜索 13.6 隱私和審查 13.7 圖書館分類方式 13.8 數據融合第14章 網絡信息檢索資源 14.1 入門階段的資源 14.2 用於嚴肅的科學研究的資源第15章 數學指南 15.1 線性代數 15.2 佩隆弗羅貝尼烏斯定理 15.3 馬爾可夫鏈 15.4 佩隆補 15.5 隨機補 15.6 設限 15.7 聚合 15.8 去聚合第16章 術語匯編參考文獻索引