垃圾郵件檢測的問題,透過圖書和論文來找解法和答案更準確安心。 我們找到下列懶人包和總整理

垃圾郵件檢測的問題,我們搜遍了碩博士論文和台灣出版的書籍,推薦王翔寫的 深入淺出 Hyperscan:高性能正則表達式算法原理與設計 和(印)拉蒂普·杜瓦的 Keras深度學習實戰都 可以從中找到所需的評價。

另外網站垃圾郵件黑名單自我檢測工具- Phorum - 弈飛資訊線上技術論壇也說明:垃圾郵件 黑名單自我檢測工具- 由於Rainbow Mail Server 簡單易上手,加上提供無功能限制的免費版,很多個人或企業開始嘗試使用Rainbow Mail Server ...

這兩本書分別來自人民郵電 和機械工業所出版 。

國立勤益科技大學 資訊工程系 張蓺英所指導 林奇的 基於正樣本無標籤學習之中文垃圾郵件分類器 (2018),提出垃圾郵件檢測關鍵因素是什麼,來自於垃圾郵件、正樣本無標籤學習、隨機森林、邏輯回歸、單純貝氏分類。

最後網站基于增量学习算法的校园网垃圾邮件检测模型則補充:实验结果表明,在执行了若干回合分类策略的调整后,该检测的准确度可以达到94.7%。该设计可以有效地检测内部垃圾邮件宿主机行为,继而从根源上抑制了垃圾邮件的产生。

接下來讓我們看這些論文和書籍都說些什麼吧:

除了垃圾郵件檢測,大家也想知道這些:

深入淺出 Hyperscan:高性能正則表達式算法原理與設計

為了解決垃圾郵件檢測的問題,作者王翔 這樣論述:

《深入淺出 Hyperscan:高性能規則運算式演算法原理與設計》系統、循序漸進地介紹Hyperscan技術。全書共8章,主要介紹規則運算式、匹配演算法和規則運算式匹配所依賴的自動機原理、規則運算式匹配庫等,並重點介紹Hyperscan的功能特性、設計原理和性能調優技巧,以及匹配引擎的核心演算法和SIMD加速技術的運用,還展示了Hyperscan多樣化的應用場景。 《深入淺出 Hyperscan:高性能規則運算式演算法原理與設計》既適合作為Hyperscan開發者的學習用書,也適合作為高等院校電腦相關專業的師生用書和相關培訓學校的教材。 1章 規則運算式簡介 1  1.1

 規則運算式的語法 1  1.2 規則運算式的流派與標準 7  1.2.1 PCRE簡介 7  1.2.2 POSIX標準 8  1.3 本章參考 10  2章 規則運算式匹配演算法 11  2.1 純字串匹配 11  2.1.1 單字串匹配KMP演算法 11  2.1.2 單字串匹配BM演算法 16  2.1.3 多字串匹配AC演算法 21  2.1.4 AC演算法與單字串匹配 24  2.1.5 SHIFT-OR演算法 25  2.2 非確定性有限狀態自動機 28  2.2.1 定義 28  2.2.2 運算優先順序 29  2.2.3 Thompson構造法 31  2.2.4 ε-N

FA的簡化 34  2.2.5 Glushkov構造法 36  2.3 確定性有限狀態自動機 40  2.3.1 定義 40  2.3.2 從NFA到DFA 40  2.3.3 DFA的狀態規模 46  2.3.4 DFA的狀態*小化 52  2.4 本章參考 55  3章 規則運算式匹配庫 56  3.1 PCRE 56  3.1.1 語法支援 56  3.1.2 設計概述 57  3.1.3 基本API和示例代碼 58  3.2 RE2 60  3.2.1 語法支援 60  3.2.2 設計概述 60  3.2.3 基本API和示例代碼 60  3.3 Hyperscan 61  3.3

.1 語法支援 61  3.3.2 匹配模式 62  3.3.3 設計概述 63  3.3.4 基本API和示例代碼 64  3.4 規則運算式匹配庫的比較 65  3.4.1 概述 65  3.4.2 語法支援 65  3.4.3 設計原理 66  3.4.4 性能 68  3.5 本章參考 70  4章 Hyperscan特性 71  4.1 Hyperscan的語義 71  4.2 編譯期和運行期 71  4.2.1 編譯期 72  4.2.2 運行期 74  4.3 Hyperscan*級特性 77  4.3.1 流狀態壓縮 77  4.3.2 近似匹配 78  4.3.3 邏輯組合

79  4.3.4 Chimera 80  4.4 Hyperscan工具 82  4.4.1 hsbench 82  4.4.2 hscheck 84  4.4.3 hscollider 85  4.4.4 hsdump 88  5章 Hyperscan設計原理 92  5.1 設計原則 92  5.1.1 實用性優先 92  5.1.2 端情況可用 93  5.1.3 流模式支援 93  5.1.4 大規模可擴展 93  5.1.5 小規模高性能 94  5.1.6 性能優先 94  5.1.7 平衡開銷 94  5.1.8 漸進主義 95  5.1.9 可測試性設計和自動可測試性設計

96  5.2 運行原理 96  5.2.1 匹配元件 97  5.2.2 匹配原則 100  5.2.3 運行期實現 103  5.2.4 運行期優化 108  5.3 圖分解 112  5.3.1 支配路徑分析 114  5.3.2 支配區域分析 115  5.3.3 網路流分析 116  5.3.4 圖分解流程 117  5.4 圖優化 122  5.4.1 節點冗餘 123  5.4.2 邊冗餘 129  5.5 本章參考 132  6章 Hyperscan引擎 133  6.1 SIMD加速 133  6.1.1 搜索單字元的加速 133  6.1.2 搜索雙字元序列的加速 13

4  6.1.3 搜索小規模單字元集的加速 136  6.1.4 搜索大規模單字元集的加速 140  6.1.5 環視機制 143  6.2 純字串匹配 148  6.2.1 純字串匹配在Hyperscan中的作用 148  6.2.2 單字串匹配器“odle” 148  6.2.3 大規模多字串匹配器“FDR” 150  6.2.4 小規模多字串匹配器“Teddy” 156  6.3 正則引擎 160  6.3.1 NFA引擎 160  6.3.2 DFA引擎 168  6.3.3 重複引擎 186  6.3.4 Tamarama 197  7章 Hyperscan性能優化 199  7.

1 Hyperscan性能測試 199  7.1.1 性能測試目的 199  7.1.2 基於性能的硬體和GRUB配置 199  7.1.3 hsbench測試 201  7.2 Hyperscan性能調優技巧 205  7.2.1 規則運算式構造 206  7.2.2 軟體庫的使用 207  7.2.3 塊模式 207  7.2.4 資料庫分配 209  7.2.5 scratch記憶體分配 209  7.2.6 錨定規則 211  7.2.7 隨處匹配的規則 212  7.2.8 流模式下的重複語義 213  7.2.9 青睞字串 214  7.2.10 DOTALL標誌 215  7.2

.11 單次匹配標誌 216  7.2.12 Start of Match標誌 217  7.2.13 近似匹配 218  8章 Hyperscan實際案例學習 221  8.1 Srt 221  8.1.1 介紹 221  8.1.2 Hyperscan集成 222  8.1.3 基於記憶體的性能測試 225  8.2 Suricata 229  8.2.1 介紹 229  8.2.2 Hyperscan集成 229  8.2.3 基於記憶體的性能測試 234  8.3 垃圾郵件檢測 238  8.4 深度報文檢測 242  8.4.1 nDPI 242  8.4.2 UDPI 245 

8.5 資料庫 247  8.5.1 整合概述 248  8.5.2 實驗結果與分析 250  8.6 Web應用防火牆 254

基於正樣本無標籤學習之中文垃圾郵件分類器

為了解決垃圾郵件檢測的問題,作者林奇 這樣論述:

隨著現今社會網路與通訊設備的迅速發展,以及全球節能減碳的倡導下,電子郵件已是現代人生活與工作中不可或缺的重要通訊管道。電子郵件不僅使用簡單、傳輸快速,更比傳統紙本信件成本更低。但正因電子郵件的廣泛應用,引來了許多想從中獲利的有心人士,利用大量電子郵件散播廣告,誘使使用者購買商品,藉此獲得龐大利益 。甚至會有電腦駭客利用此方法進行網路攻擊,導致使用者電腦被感染入侵、竊取資料…等等。本論文,為了解決現實生活中有標記類別之郵件得來不易,本研究使用正樣本無標籤學習方法來建構垃圾郵件(Spam)分類器。通過結合少量正樣本以及大量未標記之郵件,可從未標記郵件中提取可靠的負樣本。接著使用隨機森林、邏輯回歸

、單純貝氏算法,訓練垃圾郵件檢測的分類器,並在最後證明正樣本無標學習的有效性。

Keras深度學習實戰

為了解決垃圾郵件檢測的問題,作者(印)拉蒂普·杜瓦 這樣論述:

採用Python編寫的Keras能夠快速準確地訓練卷積和遞迴神經網路,這使得Keras在很短的時間裡就成為一個流行的深度學習庫。 本書介紹了如何在時下流行的Keras庫的幫助下,解決訓練深度學習模型時遇到的各種問題。從安裝和設置Keras開始,展示了如何使用Keras進行深度學習;從載入資料到擬合、評估模型獲得性能,逐步解決工作過程中遇到的每一個問題。在本書的幫助下,你可以分別實現卷積神經網路、遞迴神經網路、生成式對抗網路等。除此之外,本書還講述了如何訓練這些模型以完成影像處理和語言處理的任務。 本書最後還給出了一些實例,可以説明你直觀地瞭解Python和Keras在深度學習上的強大功能

通過閱讀本書,你將學到: 在TensorFlow中安裝和配置Keras 使用Keras庫進行神經網路程式設計 瞭解不同的Keras層 使用Keras實現簡單的前饋神經網路、卷積神經網路和遞迴神經網路 使用各種資料集和模型進行圖像和文本分類 使用Keras開發文本摘要和強化學習模型 拉蒂普·杜瓦(Rajdeep Dua)在雲計算和大資料領域擁有超過18年的經驗。他曾在IIIT Hyderabad、ISB、IIIT Delhi和Pune College of Engineering等印度一些久負盛名的科技大學教授Spark和大資料。他目前是Salesforce印度分公司開發人員

團隊的負責人,曾在海德拉巴舉行的W3C會議上展示BigQuery和Google App Engine,並領導過Google、VMware和Microsoft的開發團隊,在雲計算相關的數百個會議上發表過演講。 曼普里特·辛格·古特(Manpreet Singh Ghotra)在企業軟體和大資料軟體的開發領域擁有超過15年的經驗。他目前在Salesforce使用Keras、Apache Spark和TensorFlow等開源庫和框架從事機器學習平臺/API的開發。他曾涉足過多個機器學習系統領域,包括情感分析、垃圾郵件檢測和異常檢測。此外,他還曾是線上零售商之一的機器學習團隊的成員,使用Apach

e Mahout計算轉運時間、開發推薦系統。 譯者序 審校者簡介 前言 第1章 Keras安裝 1 1.1 引言 1 1.2 在Ubuntu 16.04上安裝Keras 1 1.2.1 準備工作 2 1.2.2 怎麼做 2 1.3 在Docker鏡像中使用Jupyter Notebook安裝Keras 7 1.3.1 準備工作 7 1.3.2 怎麼做 7 1.4 在已啟動GPU的Ubuntu 16.04上安裝Keras 9 1.4.1 準備工作 9 1.4.2 怎麼做 10 第2章 Keras資料集和模型 13 2.1 引言 13 2.2 CIFAR-10資料集 13 2

.3 CIFAR-100資料集 15 2.4 MNIST資料集 17 2.5 從CSV檔載入資料 18 2.6 Keras模型入門 19 2.6.1 模型的剖析 19 2.6.2 模型類型 19 2.7 序貫模型 20 2.8 共用層模型 27 2.8.1 共用輸入層簡介 27 2.8.2 怎麼做 27 2.9 Keras函數API 29 2.9.1 怎麼做 29 2.9.2 示例的輸出 31 2.10 Keras函數API——連結層 31 2.11 使用Keras函數API進行圖像分類 32 第3章 數據預處理、優化和視覺化 36 3.1 圖像資料特徵標準化 36 3.1.1 準備工作 3

6 3.1.2 怎麼做 37 3.2 序列填充 39 3.2.1 準備工作 39 3.2.2 怎麼做 39 3.3 模型視覺化 41 3.3.1 準備工作 41 3.3.2 怎麼做 41 3.4 優化 43 3.5 示例通用代碼 43 3.6 隨機梯度下降優化法 44 3.6.1 準備工作 44 3.6.2 怎麼做 44 3.7 Adam優化演算法 47 3.7.1 準備工作 47 3.7.2 怎麼做 47 3.8 AdaDelta優化演算法 50 3.8.1 準備工作 51 3.8.2 怎麼做 51 3.9 使用RMSProp進行優化 54 3.9.1 準備工作 54 3.9.2 怎麼做 5

4 第4章 使用不同的Keras層實現分類 58 4.1 引言 58 4.2 乳腺癌分類 58 4.3 垃圾資訊檢測分類 66 第5章 卷積神經網路的實現 73 5.1 引言 73 5.2 宮頸癌分類 73 5.2.1 準備工作 74 5.2.2 怎麼做 74 5.3 數位識別 84 5.3.1 準備工作 84 5.3.2 怎麼做 85 第6章 生成式對抗網路 89 6.1 引言 89 6.2 基本的生成式對抗網路 90 6.2.1 準備工作 91 6.2.2 怎麼做 91 6.3 邊界搜索生成式對抗網路 98 6.3.1 準備工作 99 6.3.2 怎麼做 100 6.4 深度卷積生成

式對抗網路 106 6.4.1 準備工作 107 6.4.2 怎麼做 108 第7章 遞迴神經網路 116 7.1 引言 116 7.2 用於時間序列資料的簡單RNN 117 7.2.1 準備工作 118 7.2.2 怎麼做 119 7.3 時間序列資料的LSTM網路 128 7.3.1 LSTM網路 128 7.3.2 LSTM記憶示例 129 7.3.3 準備工作 129 7.3.4 怎麼做 129 7.4 使用LSTM進行時間序列預測 133 7.4.1 準備工作 134 7.4.2 怎麼做 135 7.5 基於LSTM的等長輸出序列到序列學習 143 7.5.1 準備工作 143 7

.5.2 怎麼做 144 第8章 使用Keras模型進行自然語言處理 150 8.1 引言 150 8.2 詞嵌入 150 8.2.1 準備工作 151 8.2.2 怎麼做 151 8.3 情感分析 157 8.3.1 準備工作 157 8.3.2 怎麼做 159 8.3.3 完整代碼清單 162 第9章 基於Keras模型的文本摘要 164 9.1 引言 164 9.2 評論的文本摘要 164 9.2.1 怎麼做 165 9.2.2 參考資料 172 第10章 強化學習 173 10.1 引言 173 10.2 使用Keras進行《CartPole》遊戲 174 10.3 使用競爭DQ

N演算法進行《CartPole》遊戲 181 10.3.1 準備工作 183 10.3.2 怎麼做 187