語義識別合法準確性為 99.9%
語義識別非法準確性 95% 以上
產品優勢>>
采用中文結巴分詞
采用業內領先的中文結巴分詞,將關注的非法關鍵詞、敏感關鍵詞以自定義詞匯的方式加入 分詞詞典, 使要檢測的文章以更智能的方式切分,從而不會錯過任何有可能出現的疑似非 法文章。

基于深度學習的智能分詞提取引擎
經過人工嚴格篩選后的敏感詞匯,以及 38 大類 9 萬個非法關鍵詞。傲盾基于傲盾智能 算法系統,對幾十萬篇非法文章進行深度學習可產生更多的敏感詞匯,并將詞匯都放入傲 盾智能自定義詞典中。
命中級別
根據 38 個非法關鍵詞大類,設定了不同的命中級別,如對于涉黃文章,由于其敏感詞都比較明顯,一篇文章最少命中 3 個以上敏感詞匯,即認定為疑似涉黃文章;而對于涉賭文章,
由于包含了更多的中性詞,可以讓其最少命中 5 個敏感詞匯時,才認定為疑似涉賭文章。這樣保證了不同的分類,可以靈活設定命中級別,使命中的合法和非法文章更精確,命中率更高。
當前語義的處理性能和準確性
經過嚴格的壓力測試,一天可以處理 200 萬篇文章的掃描和排查。 語義識別合法的準確性為 99.9%,語義識別非法文章的準確性 95% 以上。拒專業統計大 型IDC、ISP每天產生疑似非法的數量大概在
100至1000萬個URL,在傳統情況下需要近 百人的審核團隊,通過使用傲盾語義系統可以明顯減輕了審核團隊的工作量和準確性。

產品使用>>
