热搜词频次是如何被计算的
磁力狗的热搜榜不是简单的搜索次数累加。我们采用「TF-IDF + 时间衰减 + 去重」三步法:先用 TF-IDF 算法把关键词与历史搜索语料对比,过滤掉天然高频但无意义的词(如「下载」「合集」);再对搜索时间施加指数衰减,越靠近现在权重越高;最后按 IP 哈希去重,避免同一用户反复刷新影响排名。这套机制让本周热搜真正反映「这一周观众在搜索什么」,而不是被几个高频用户带偏。
磁力狗的热搜榜不是简单的搜索次数累加。我们采用「TF-IDF + 时间衰减 + 去重」三步法:先用 TF-IDF 算法把关键词与历史搜索语料对比,过滤掉天然高频但无意义的词(如「下载」「合集」);再对搜索时间施加指数衰减,越靠近现在权重越高;最后按 IP 哈希去重,避免同一用户反复刷新影响排名。这套机制让本周热搜真正反映「这一周观众在搜索什么」,而不是被几个高频用户带偏。
每个热搜词右侧的 +186% 或 -12% 是与上周同期的相对变化。这套数据不只是装饰,它揭示了观众兴趣的真实波动。本周《星之回响》+186% 主要来自院线版上线 + 中文配音版同步两个事件叠加;《技术书籍 EPUB》-12% 则反映了书籍下载需求的季节性回落(暑期前的常规波谷)。学会看变化趋势能让用户提前感知"下一周会火什么"——这是 jinyuanbaozhuang.com 给资深用户的小工具。
用户搜索时输入的关键词千差万别:「星之回响 2026」「星之回响 蓝光」「星之回响 高清」其实指向同一个资源。磁力狗使用基于编辑距离与语义相似度的合并算法,把这些变体在统计层归并为一个词。这种合并让热搜榜的"信号"更清晰——一个关键词的真实热度不会被自身的变体稀释。本周冠军「星之回响 2026」实际合并了 38 个变体的搜索量,是个清晰的"现象级"信号。
jinyuanbaozhuang.com 不记录任何单个用户的搜索行为。那热搜榜怎么生成?我们用「滚动窗口聚合」:每分钟把过去 60 秒所有搜索请求按 IP 哈希后聚合成"匿名计数",立即丢弃原始记录,只保留计数。一周后这些计数再被压缩为「热搜频次」入库。整个流程没有任何环节存储「用户 X 搜了什么」——只有「Y 被搜了 Z 次」。这是搜索引擎可以做到的最大隐私尊重。
每日 0 点自动重新计算,使用近 7 日数据滚动统计。下次刷新时间显示在右上角。
支持。点击词条右侧的「趋势」可查看过去 30 天的曲线,了解该关键词的搜索量如何变化。
新关键词只要在 24 小时内达到 200 次搜索即可进入候选池,进入后按算法自动计算排名。
用户端无法屏蔽,但可在「高级筛选」面板里隐藏部分类目的热搜,让首页显示更聚焦你关心的类型。