java实现威尔逊置信区间(Wilson score interval)推荐算法

作者： ʘᴗʘ发布时间：2021-12-08 20:08 浏览量：398 点赞：285 售价：0元

前言

最近coderbbb升级文章的排序、推荐算法，有一个排序规则是基于有效阅读和总阅读的比值排序的。类似这样的排序需求很常见，通常都有一个绕不开的问题：当数据量比较小的时候，这个比值的可信度很低。基于此，我们需要使用威尔逊置信区间(Wilson score interval)来解决该问题。

关于威尔逊置信区间(Wilson score interval)的原理介绍，可以参考：威尔逊置信区间(Wilson score interval)

Java实现威尔逊置信区间(Wilson score interval)算法

强烈建议引用成熟库，自己实现算法是一个体力活。这里推荐Apache的commons-math3库对该算法的实现。

引入apache commons math3库

maven pom.xml文件中，添加apache commons math3的依赖，代码如下：

<dependency>
    <groupId>org.apache.commons</groupId>
    <artifactId>commons-math3</artifactId>
    <version>3.6.1</version>
</dependency>

计算威尔逊置信区间

直接使用apache commons math3的WilsonScoreInterval类中的createInterval方法计算威尔逊置信区间。代码如下：

public static void main(String[] args) throws Exception {

   /**
    * 10个阅读，3个点赞
    */
   ConfidenceInterval interval = new WilsonScoreInterval().createInterval(10, 3, 0.95);
   System.out.println(interval.getLowerBound() + "-" +interval.getUpperBound());

}

createInterval (int numberOfTrials, int numberOfSuccesses, double confidenceLevel)参数解释：

numberOfTrials 必须大于0，代表总阅读量。（实验次数）
numberOfSuccesses 点赞数，不能大于第一个参数。（成功次数）
confidenceLevel 必须介于 0 和 1 之间（不包括），成功的真实概率落在返回区间内的期望概率。

返回值：返回一个ConfidenceInterval对象，该对象包含置信区间的上限、下限等数据。我们一般排序是用置信区间的下限排序，该值越高，代表文章的质量越好。

原文链接：https://www.coderbbb.com/articles/51

其它推荐：

Java实现版本号比较算法
本文通过Java实现了判断常见版本号的比较算法，支持数字、特殊符号、字母等多种字符构成的版本号比较。
Google AdSense广告高度宽度错误、无法自适应的完美解决方案
本文介绍了如何设置Google AdSense广告位的宽度、高度，解决Google AdSense广告位宽度、高度过大、过小造成的页面重叠、变形问题。
【thymeleaf文档精华版】springboot thymeleaf常用语法中文教程
现在虽然Vue、React等前端框架盛行，但是部分需要SEO的页面，还是得用thymeleaf之类的模板引擎来渲染。thymeleaf的官方文档，写的太过详细，显得比较啰嗦。本文主要是把thymeleaf官方的英文文档，结合作者自己的使用经验，整理成了一篇可以用来速查的中文教程，方便大家。
Springboot使用redis的setnx和getset实现并发锁、分布式锁
本文介绍如何使用redis的setnx和getset实现可用于分布式环境的redis并发锁，解决高并发、高可靠性的业务环境下，常见的原子性操作需求。代码久经验证，可放心使用。
【过来人推荐】Netty报错：LEAK: ByteBuf.release() was not called before it's garbage-collected
netty报错：ByteBuf.release() was not called before it's garbage-collected的完美解决方案！过来人经过N次该报错后总结的经验，不长篇大论讲理论，真金白银给你解决方案。
解决win10无法打开Microsoft Store
本文解决了Windows10系统无法正常打开Microsoft Store页面的问题。通过设置Internet的TLS1.2选项，完美解决该问题。
springboot整合thymeleaf完成第一个HTML网页
在当前的HTML网页开发中，虽然Vue、React等框架非常流行，但是因为部分行业、网站对搜索引擎SEO的需求，传统的模板引擎仍有一席之地。本文继续使用上文生成的Demo工程，通过引入thymeleaf来完成我们的第一个网页。
Intellij IDE代码行数统计插件Statistic推荐
本文介绍了一种能够快速统计IntelliJ项目代码行数的插件：Statistic，通过该插件可以快速查看各个项目、目录的代码行数，还能具体查看项目中不同代码语言的具体行数，十分方便。
springboot使用redis限制并发请求、限流
日常开发中经常会遇到需要限流、限制并发的需求，网上有很多算法、框架的介绍，但通常比较复杂，对于小项目来讲过于复杂。本文介绍了一种通过redis incr函数来实现的简便限流算法，并提供了完整源代码，可以快速的整合到你的项目中，实现API限流。
解决Win10开启网络唤醒后，不停的自动唤醒问题
win10开启网卡的自动唤醒功能后，出现了一睡眠就自动唤醒的问题。本文通过配置网卡唤醒选项，完美解决该问题。

ʘᴗʘ

评级：

77: 文章数

75250: 浏览量

57674: 获赞数

67.80: 总收入

本文目录

本文为付费文章

点击图片购买本文后，全文代码即可变为文本，可复制。还可与本文作者在线沟通哦！

本文售价：0.10元

java实现威尔逊置信区间(Wilson score interval)推荐算法

前言

Java实现威尔逊置信区间(Wilson score interval)算法

引入apache commons math3库

计算威尔逊置信区间

Java实现版本号比较算法

Google AdSense广告高度宽度错误、无法自适应的完美解决方案

【thymeleaf文档精华版】springboot thymeleaf常用语法中文教程

Springboot使用redis的setnx和getset实现并发锁、分布式锁

【过来人推荐】Netty报错：LEAK: ByteBuf.release() was not called before it's garbage-collected

解决win10无法打开Microsoft Store

springboot整合thymeleaf完成第一个HTML网页

Intellij IDE代码行数统计插件Statistic推荐

springboot使用redis限制并发请求、限流

解决Win10开启网络唤醒后，不停的自动唤醒问题