Java实现的朴素贝叶斯算法示例

2025-05-13 05:31:29

本文实例讲述了Java实现的朴素贝叶斯算法。分享给大家供大家参考，具体如下：

对于朴素贝叶斯算法相信做数据挖掘和推荐系统的小伙们都耳熟能详了，算法原理我就不啰嗦了。我主要想通过java代码实现朴素贝叶斯算法，思想：

1. 用javabean +Arraylist 对于训练数据存储

2. 对于样本数据训练

具体的代码如下：

package NB;
/**
 * 训练样本的属性 javaBean
 *
 */
public class JavaBean {
 int age;
 String income;
 String student;
 String credit_rating;
 String buys_computer;
 public JavaBean(){
 }
public JavaBean(int age,String income,String student,String credit_rating,String buys_computer){
  this.age=age;
  this.income=income;
  this.student=student;
  this.credit_rating=credit_rating;
  this.buys_computer=buys_computer;
}
public int getAge() {
  return age;
}
public void setAge(int age) {
  this.age = age;
}
public String getIncome() {
  return income;
}
public void setIncome(String income) {
  this.income = income;
}
public String getStudent() {
  return student;
}
public void setStudent(String student) {
  this.student = student;
}
public String getCredit_rating() {
  return credit_rating;
}
public void setCredit_rating(String credit_rating) {
  this.credit_rating = credit_rating;
}
public String getBuys_computer() {
  return buys_computer;
}
public void setBuys_computer(String buys_computer) {
  this.buys_computer = buys_computer;
}
@Override
public String toString() {
  return "JavaBean [age=" + age + ", income=" + income + ", student="
      + student + ", credit_rating=" + credit_rating + ", buys_computer="
      + buys_computer + "]";
}
}

算法实现的部分：

package NB;
import java.io.BufferedReader;
import java.io.File;
import java.io.FileReader;
import java.util.ArrayList;
public class TestNB {
  /**data_length
   * 算法的思想
   */
  public static ArrayList<JavaBean> list = new ArrayList<JavaBean>();;
  static int data_length=0;
  public static void main(String[] args) {
    // 1.读取数据，放入list容器中
    File file = new File("E://test.txt");
    txt2String(file);
    //数据测试样本
    testData(25,"Medium","Yes","Fair");
  }
  // 读取样本数据
  public static void txt2String(File file) {
    try {
      BufferedReader br = new BufferedReader(new FileReader(file));// 构造一个BufferedReader类来读取文件
      String s = null;
      while ((s = br.readLine()) != null) {// 使用readLine方法，一次读一行
        data_length++;
        splitt(s);
      }
      br.close();
    } catch (Exception e) {
      e.printStackTrace();
    }
  }
  // 存入ArrayList中
   public static void splitt(String str){
      String strr = str.trim();
      String[] abc = strr.split("[\\p{Space}]+");
      int age=Integer.parseInt(abc[0]);
      JavaBean bean=new JavaBean(age, abc[1], abc[2], abc[3], abc[4]);
      list.add(bean);
    }
   // 训练样本，测试
   public static void testData(int age,String a,String b,String c){
     //训练样本
     int number_yes=0;
     int bumber_no=0;
     // age情况 个数
     int num_age_yes=0;
     int num_age_no=0;
     // income
     int num_income_yes=0;
     int num_income_no=0;
     // student
     int num_student_yes=0;
     int num_stdent_no=0;
     //credit
     int num_credit_yes=0;
     int num_credit_no=0;
     //遍历List 获得数据
     for(int i=0;i<list.size();i++){
      JavaBean bb=list.get(i);
      if(bb.getBuys_computer().equals("Yes")){ //Yes
        number_yes++;
        if(bb.getIncome().equals(a)){//income
          num_income_yes++;
        }
        if(bb.getStudent().equals(b)){//student
          num_student_yes++;
        }
        if(bb.getCredit_rating().equals(c)){//credit
          num_credit_yes++;
        }
        if(bb.getAge()==age){//age
          num_age_yes++;
        }
      }else {//No
        bumber_no++;
        if(bb.getIncome().equals(a)){//income
          num_income_no++;
        }
        if(bb.getStudent().equals(b)){//student
          num_stdent_no++;
        }
        if(bb.getCredit_rating().equals(c)){//credit
          num_credit_no++;
        }
        if(bb.getAge()==age){//age
          num_age_no++;
        }
      }
     }
      System.out.println("购买的历史个数:"+number_yes);
      System.out.println("不买的历史个数:"+bumber_no);
      System.out.println("购买+age:"+num_age_yes);
      System.out.println("不买+age:"+num_age_no);
      System.out.println("购买+income:"+num_income_yes);
      System.out.println("不买+income:"+num_income_no);
      System.out.println("购买+stundent:"+num_student_yes);
      System.out.println("不买+student:"+num_stdent_no);
      System.out.println("购买+credit:"+num_credit_yes);
      System.out.println("不买+credit:"+num_credit_no);
      //// 概率判断
      double buy_yes=number_yes*1.0/data_length; // 买的概率
      double buy_no=bumber_no*1.0/data_length; // 不买的概率
      System.out.println("训练数据中买的概率:"+buy_yes);
      System.out.println("训练数据中不买的概率:"+buy_no);
      /// 未知用户的判断
      double nb_buy_yes=(1.0*num_age_yes/number_yes)*(1.0*num_income_yes/number_yes)*(1.0*num_student_yes/number_yes)*(1.0*num_credit_yes/number_yes)*buy_yes;
      double nb_buy_no=(1.0*num_age_no/bumber_no)*(1.0*num_income_no/bumber_no)*(1.0*num_stdent_no/bumber_no)*(1.0*num_credit_no/bumber_no)*buy_no;
      System.out.println("新用户买的概率:"+nb_buy_yes);
      System.out.println("新用户不买的概率:"+nb_buy_no);
      if(nb_buy_yes>nb_buy_no){
        System.out.println("新用户买的概率大");
      }else {
        System.out.println("新用户不买的概率大");
      }
   }
}

对于样本数据：

25 High    No Fair       No
25 High    No Excellent No
33 High    No Fair       Yes
41 Medium No Fair       Yes
41 Low     Yes Fair       Yes
41 Low     Yes Excellent No
33 Low     Yes Excellent Yes
25 Medium No Fair       No
25 Low     Yes Fair       Yes
41 Medium Yes Fair       Yes
25 Medium Yes Excellent Yes
33 Medium No Excellent Yes
33 High    Yes Fair       Yes
41 Medium No Excellent No

对于未知用户的数据得出的结果：

购买的历史个数:9
不买的历史个数:5
购买+age:2
不买+age:3
购买+income:4
不买+income:2
购买+stundent:6
不买+student:1
购买+credit:6
不买+credit:2
训练数据中买的概率:0.6428571428571429
训练数据中不买的概率:0.35714285714285715
新用户买的概率:0.028218694885361547
新用户不买的概率:0.006857142857142858
新用户买的概率大

更多关于java算法相关内容感兴趣的读者可查看本站专题：《Java数据结构与算法教程》、《Java操作DOM节点技巧总结》、《Java文件与目录操作技巧汇总》和《Java缓存操作技巧汇总》

希望本文所述对大家java程序设计有所帮助。

Python实现的knn算法示例

本文实例讲述了Python实现的knn算法.分享给大家供大家参考,具体如下: 代码参考机器学习实战那本书: 机器学习实战 (Peter Harrington著) 中文版机器学习实战 (Peter Harrington著) 英文原版[附源代码] 有兴趣你们可以去了解下具体代码: # -*- coding:utf-8 -*- #! python2 ''''' @author:zhoumeixu createdate:2015年8月27日 ''' #np.zeros((4,2)) #np.zero
Java实现走迷宫回溯算法

以一个M×N的长方阵表示迷宫,0和1分别表示迷宫中的通路和障碍.设计一个程序,对任意设定的迷宫,求出一条从入口到出口的通路,或得出没有通路的结论. (1) 根据二维数组,输出迷宫的图形. (2) 探索迷宫的四个方向:RIGHT为向右,DOWN向下,LEFT向左,UP向上,输出从入口到出口的行走路径. 例子: 左上角(1,1)为入口,右下角(8,9)为出口. 可使用回溯方法,即从入口出发,顺着某一个方向进行探索,若能走通,则继续往前进:否则沿着原路退回,换一个方向继续探索,直至出口位置,求得一条通
Java实现的KNN算法示例

本文实例讲述了Java实现的KNN算法.分享给大家供大家参考,具体如下: 提起KNN算法大家应该都不会陌生,对于数据挖掘来说算是十大经典算法之一. 算法的思想是:对于训练数据集中已经归类的分组,来对于未知的数据进行分组归类.其中是根据该未知点与其训练数据中的点计算距离,求出距离最短的点,并将其归入该点的那一类. 看看算法的工程吧: 1. 准备数据,对数据进行预处理 2. 选用合适的数据结构存储训练数据和测试元组 3. 设定参数,如k 4.维护一个大小为k的的按距离由大到小的优先级队列,用于存储最
Java实现的傅里叶变化算法示例

本文实例讲述了Java实现的傅里叶变化算法.分享给大家供大家参考,具体如下: 用JAVA实现傅里叶变化结果为复数形式 a+bi 废话不多说,实现代码如下,共两个class FFT.class 傅里叶变化功能实现代码 package fft.test; /************************************************************************* * Compilation: javac FFT.java Execution: java FF
JAVA实现感知器算法

简述随着互联网的高速发展,A(AI)B(BigData)C(Cloud)已经成为当下的核心发展方向,假如三者深度结合的话,AI是其中最核心的部分.所以如果说在未来社会,每个人都必须要学会编程的话,那么对于程序员来说,人工智能则是他们所必须掌握的技术(科技发展真tm快). 这篇文章介绍并用JAVA实现了一种最简单的感知器网络,不纠结于公式的推导,旨在给大家提供一下学习神经网络的思路,对神经网络有一个大概的认识. 感知器网络模型分析首先看一张图如果稍微对神经网络感兴趣的一定对这张图不陌生,这张
Java实现五子棋AI算法

五子棋AI算法也算是一个典型的游戏AI算法,一些棋类的AI算法都可以参考实现,下面是Java实现代码棋盘抽象接口 import java.util.List; public interface IChessboard { //取得棋盘最大横坐标 public int getMaxX(); //最大纵坐标 public int getMaxY(); //取得当前所有空白点,这些点才可以下棋 public List<Point> getFreePoints(); } 棋子类实现 //棋子类 p
kNN算法python实现和简单数字识别的方法

本文实例讲述了kNN算法python实现和简单数字识别的方法.分享给大家供大家参考.具体如下: kNN算法算法优缺点: 优点:精度高.对异常值不敏感.无输入数据假定缺点:时间复杂度和空间复杂度都很高适用数据范围:数值型和标称型算法的思路: KNN算法(全称K最近邻算法),算法的思想很简单,简单的说就是物以类聚,也就是说我们从一堆已知的训练集中找出k个与目标最靠近的,然后看他们中最多的分类是哪个,就以这个为依据分类. 函数解析: 库函数: tile() 如tile(A,n)就是将A重复n次
python使用KNN算法手写体识别

本文实例为大家分享了用KNN算法手写体识别的具体代码,供大家参考,具体内容如下 #!/usr/bin/python #coding:utf-8 import numpy as np import operator import matplotlib import matplotlib.pyplot as plt import os ''''' KNN算法 1. 计算已知类别数据集中的每个点依次执行与当前点的距离. 2. 按照距离递增排序. 3. 选取与当前点距离最小的k个点 4. 确定前k个点所
以Python代码实例展示kNN算法的实际运用

邻近算法,或者说K最近邻(kNN,k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一.所谓K最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表. kNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性.该方法在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别. kNN方法在类别决策时,只与极少量的相邻样本有关.由于kNN方法主
使用栈的迷宫算法java版代码

本文为大家分享了使用栈的迷宫算法java版,主要考察栈的使用,供大家参考,具体内容如下主要思路如下: do { if(当前位置可通过) { 标记此位置已走过; 保存当前位置并入栈; if(当前位置为终点) { 程序结束; } 获取下一个位置; } else { if(栈非空) { 出栈: while(当前位置方向为4且栈非空) { 标记当前位置不可走; 出栈; } if(当前位置的方向小于4) { 方向+1; 重新入栈; 获取下一个位置; } } } } while (栈非空); java代码
Java实现Floyd算法求最短路径

本文实例为大家分享了Java实现Floyd算法求最短路径的具体代码,供大家参考,具体内容如下 import java.io.FileInputStream; import java.io.FileNotFoundException; import java.util.Scanner; public class TestMainIO { /** * @param args * @throws FileNotFoundException */ public static void main(Stri

Java实现的朴素贝叶斯算法示例

相关推荐

随机推荐