计算百度关键词出现密度

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
/// <summary>
/// 获取百度关键词出现的密度
/// </summary>
/// <param name="keyWord">标题、关键词</param>
/// <returns>如:10 (满为100)</returns>
public static int GetBaiDuKeywordDensity(string keyWord)
{
    //获取百度源码
    string HtmlCode = GetHttpData("http://www.baidu.com/s?wd=" + keyWord);
    //百度搜索出来的标题列表
    List<string> listTitle = new List<string>();
    //列表正则匹配规则
    string strrex = @"<h3[\s\S]*?>(?<url>.*?)</h3>";
 
    //进行正则匹配
    MatchCollection mc = Regex.Matches(HtmlCode, strrex);
    foreach (Match m in mc)
    {
        string content =HtmlDecodes(Environment.NewLine + m.Groups["url"].Value);
     content=   ReplaceHtml(content);
        listTitle.Add(RemoveHTML(content));
    }
 
    //只匹配第一条
    for (int i = 0; i < listTitle.Count; i++)
    {
        return Convert.ToInt32(Similarity(listTitle[0], keyWord) * 100);
    }
 
    //相似度列表
   // List<double> listSimilarity = new List<double>();
    //进行相似度计算
    //foreach (string strTitle in listTitle)
    //{
    //    listSimilarity.Add(Similarity(strTitle, keyWord));
    //}
 
    //进行密度计算
    //int dev = Convert.ToInt32(stdev(listSimilarity) * 100);
    //if (dev<=0 || dev > 100)
    //{
    //    dev = Convert.ToInt32(average(listSimilarity) * 100);
    //}
    //return dev ;
    return 0;
}

  

posted @   逊老头  阅读(136)  评论(0编辑  收藏  举报
编辑推荐:
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
阅读排行:
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
点击右上角即可分享
微信分享提示