Java汉字转拼音类库Pinyin4j详细使用方法与实例

汉字转拼音类库Pinyin4j一般用法

pinyin4j的使用很方便,一般转换只需要使用PinyinHelper类的静态工具方法即可:

String[] pinyin = PinyinHelper.toHanyuPinyinStringArray(‘刘');
//该类还有其他的拼音转换形式,但是基本上用不到,就不介绍了

返回的数组即是该字符的拼音,如上例就是pinyin[0]=liu2,后面的数字代表声调,声调为5表示轻读,无声调。之所谓返回数组,是因为被判定的汉字有可能有多个读音。如果输入的参数不是汉字,则返回null。

拼音格式化

如果对于拼音转换后的结果有一些特定的格式要求目前pinyin4j支持:

声调格式化。例如:“刘”字的格式化后为“liu2”或“liu”或“liú”

对特殊拼音ü的的显示格式。例如“u:”或“v”或“ü”

大小写的转换。例如:“liu2”或“LIU2”

以上这些格式可以混合使用,下面就来介绍具体的使用方法,首先需要创建格式化对象HanyuPinyinOutputFormat,例如:

HanyuPinyinOutputFormat outputFormat = new HanyuPinyinOutputFormat();

然后分别调用outputFormat的set方法设置上述一些格式要求:

设置声调格式:

outputFormat.setToneType(HanyuPinyinToneType);

方法参数HanyuPinyinToneType有以下常量对象:

HanyuPinyinToneType.WITH_TONE_NUMBER 用数字表示声调,例如:liu2

HanyuPinyinToneType.WITHOUT_TONE 无声调表示,例如:liu

HanyuPinyinToneType.WITH_TONE_MARK 用声调符号表示,例如:liú

设置特殊拼音ü的显示格式:

outputFormat.setVCharType(HanyuPinyinVCharType);

方法参数HanyuPinyinVCharType有以下常量对象:

HanyuPinyinVCharType.WITH_U_AND_COLON 以U和一个冒号表示该拼音,例如:lu:

HanyuPinyinVCharType.WITH_V 以V表示该字符,例如:lv

HanyuPinyinVCharType.WITH_U_UNICODE 以ü表示

设置大小写格式

outputFormat.setCaseType(HanyuPinyinCaseType);

HanyuPinyinCaseType.LOWERCASE 转换后以全小写方式输出

HanyuPinyinCaseType.UPPERCASE 转换后以全大写方式输出

设置好格式对象后还是利用上述的工具类方法进行拼音转换,只不过需要将格式化对象当成方法参数传入转换方法,告知要转换的格式要求:

String[] pinyin = PinyinHelper.toHanyuPinyinStringArray(‘刘', outputFormat);

但该方法会有异常抛出,注意处理。

示例

import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType;
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;
public class Test {
  public static void main(String[] args) {
import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType;
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;
public class Test {
  public static void main(String[] args) {
    HanyuPinyinOutputFormat outputFormat = new HanyuPinyinOutputFormat();
    outputFormat.setToneType(HanyuPinyinToneType.WITH_TONE_MARK);
    outputFormat.setVCharType(HanyuPinyinVCharType.WITH_U_UNICODE);
    outputFormat.setCaseType(HanyuPinyinCaseType.UPPERCASE);
    try {
      System.out.println(concatPinyinStringArray(PinyinHelper.toHanyuPinyinStringArray('刘',outputFormat)));
    } catch (BadHanyuPinyinOutputFormatCombination e) {
      // TODO Auto-generated catch block
      e.printStackTrace();
    }
  }

  private static String concatPinyinStringArray(String[] pinyinArray)
  {
    StringBuffer pinyinStrBuf = new StringBuffer();
    if ((null != pinyinArray) && (pinyinArray.length > 0))
    {
      for (int i = 0; i < pinyinArray.length; i++)
      {
        pinyinStrBuf.append(pinyinArray[i]);
        pinyinStrBuf.append(System.getProperty("line.separator"));
      }
    }
    String outputString = pinyinStrBuf.toString();
    return outputString;
  }
}

输出结果为:LIú

其他

PinyinHelper还有其他的静态方法,但示例和讲解中使用的方法是常见的拼音格式,因此其他静态方法我没有调研其含义。

貌似支持生僻字,我试过很怪异的字,都可以将其读音拼写出来,因此这个工具包还是很强的。

拼音工具

package cn.itcast.bos.utils;

import java.util.Arrays;

import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;

public class PinYin4jUtils {
  /**
   * 将字符串转换成拼音数组
   *
   * @param src
   * @return
   */
  public static String[] stringToPinyin(String src) {
    return stringToPinyin(src, false, null);
  }

  /**
   * 将字符串转换成拼音数组
   *
   * @param src
   * @return
   */
  public static String[] stringToPinyin(String src, String separator) {

    return stringToPinyin(src, true, separator);
  }

  /**
   * 将字符串转换成拼音数组
   *
   * @param src
   * @param isPolyphone
   *      是否查出多音字的所有拼音
   * @param separator
   *      多音字拼音之间的分隔符
   * @return
   */
  public static String[] stringToPinyin(String src, boolean isPolyphone,
      String separator) {
    // 判断字符串是否为空
    if ("".equals(src) || null == src) {
      return null;
    }
    char[] srcChar = src.toCharArray();
    int srcCount = srcChar.length;
    String[] srcStr = new String[srcCount];

    for (int i = 0; i < srcCount; i++) {
      srcStr[i] = charToPinyin(srcChar[i], isPolyphone, separator);
    }
    return srcStr;
  }

  /**
   * 将单个字符转换成拼音
   *
   * @param src
   * @return
   */
  public static String charToPinyin(char src, boolean isPolyphone,
      String separator) {
    // 创建汉语拼音处理类
    HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
    // 输出设置,大小写,音标方式
    defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
    defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);

    StringBuffer tempPinying = new StringBuffer();

    // 如果是中文
    if (src > 128) {
      try {
        // 转换得出结果
        String[] strs = PinyinHelper.toHanyuPinyinStringArray(src,
            defaultFormat);

        // 是否查出多音字,默认是查出多音字的第一个字符
        if (isPolyphone && null != separator) {
          for (int i = 0; i < strs.length; i++) {
            tempPinying.append(strs[i]);
            if (strs.length != (i + 1)) {
              // 多音字之间用特殊符号间隔起来
              tempPinying.append(separator);
            }
          }
        } else {
          tempPinying.append(strs[0]);
        }

      } catch (BadHanyuPinyinOutputFormatCombination e) {
        e.printStackTrace();
      }
    } else {
      tempPinying.append(src);
    }

    return tempPinying.toString();

  }

  public static String hanziToPinyin(String hanzi) {
    return hanziToPinyin(hanzi, " ");
  }

  /**
   * 将汉字转换成拼音
   *
   * @param hanzi
   * @param separator
   * @return
   */
  public static String hanziToPinyin(String hanzi, String separator) {

    // 创建汉语拼音处理类
    HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
    // 输出设置,大小写,音标方式
    defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
    defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);

    String pinyingStr = "";
    try {
      pinyingStr = PinyinHelper.toHanyuPinyinString(hanzi, defaultFormat,
          separator);
    } catch (BadHanyuPinyinOutputFormatCombination e) {
      // TODO Auto-generated catch block
      e.printStackTrace();
    }
    return pinyingStr;
  }

  /**
   * 将字符串数组转换成字符串
   *
   * @param str
   * @param separator
   *      各个字符串之间的分隔符
   * @return
   */
  public static String stringArrayToString(String[] str, String separator) {
    StringBuffer sb = new StringBuffer();
    for (int i = 0; i < str.length; i++) {
      sb.append(str[i]);
      if (str.length != (i + 1)) {
        sb.append(separator);
      }
    }
    return sb.toString();
  }

  /**
   * 简单的将各个字符数组之间连接起来
   *
   * @param str
   * @return
   */
  public static String stringArrayToString(String[] str) {
    return stringArrayToString(str, "");
  }

  /**
   * 将字符数组转换成字符串
   *
   * @param str
   * @param separator
   *      各个字符串之间的分隔符
   * @return
   */
  public static String charArrayToString(char[] ch, String separator) {
    StringBuffer sb = new StringBuffer();
    for (int i = 0; i < ch.length; i++) {
      sb.append(ch[i]);
      if (ch.length != (i + 1)) {
        sb.append(separator);
      }
    }
    return sb.toString();
  }

  /**
   * 将字符数组转换成字符串
   *
   * @param str
   * @return
   */
  public static String charArrayToString(char[] ch) {
    return charArrayToString(ch, " ");
  }

  /**
   * 取汉字的首字母
   *
   * @param src
   * @param isCapital
   *      是否是大写
   * @return
   */
  public static char[] getHeadByChar(char src, boolean isCapital) {
    // 如果不是汉字直接返回
    if (src <= 128) {
      return new char[] { src };
    }
    // 获取所有的拼音
    String[] pinyingStr = PinyinHelper.toHanyuPinyinStringArray(src);

    // 创建返回对象
    int polyphoneSize = pinyingStr.length;
    char[] headChars = new char[polyphoneSize];
    int i = 0;
    // 截取首字符
    for (String s : pinyingStr) {
      char headChar = s.charAt(0);
      // 首字母是否大写,默认是小写
      if (isCapital) {
        headChars[i] = Character.toUpperCase(headChar);
      } else {
        headChars[i] = headChar;
      }
      i++;
    }

    return headChars;
  }

  /**
   * 取汉字的首字母(默认是大写)
   *
   * @param src
   * @return
   */
  public static char[] getHeadByChar(char src) {
    return getHeadByChar(src, true);
  }

  /**
   * 查找字符串首字母
   *
   * @param src
   * @return
   */
  public static String[] getHeadByString(String src) {
    return getHeadByString(src, true);
  }

  /**
   * 查找字符串首字母
   *
   * @param src
   * @param isCapital
   *      是否大写
   * @return
   */
  public static String[] getHeadByString(String src, boolean isCapital) {
    return getHeadByString(src, isCapital, null);
  }

  /**
   * 查找字符串首字母
   *
   * @param src
   * @param isCapital
   *      是否大写
   * @param separator
   *      分隔符
   * @return
   */
  public static String[] getHeadByString(String src, boolean isCapital,
      String separator) {
    char[] chars = src.toCharArray();
    String[] headString = new String[chars.length];
    int i = 0;
    for (char ch : chars) {

      char[] chs = getHeadByChar(ch, isCapital);
      StringBuffer sb = new StringBuffer();
      if (null != separator) {
        int j = 1;

        for (char ch1 : chs) {
          sb.append(ch1);
          if (j != chs.length) {
            sb.append(separator);
          }
          j++;
        }
      } else {
        sb.append(chs[0]);
      }
      headString[i] = sb.toString();
      i++;
    }
    return headString;
  }

  public static void main(String[] args) {
    // pin4j 简码 和 城市编码
    String s1 = "中华人民共和国";
    String[] headArray = getHeadByString(s1); // 获得每个汉字拼音首字母
    System.out.println(Arrays.toString(headArray));

    String s2 ="长城" ;
    System.out.println(Arrays.toString(stringToPinyin(s2,true,",")));

    String s3 ="长";
    System.out.println(Arrays.toString(stringToPinyin(s3,true,",")));
  }
}

更多关于Java汉字转拼音类库Pinyin4j详细使用方法与实例请查看下面的相关链接

(0)

相关推荐

  • java汉字转拼音工具类分享

    本文实例为大家分享了java汉字转拼音工具类的具体代码,供大家参考,具体内容如下 import com.google.common.base.Strings; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat; import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;

  • java实现汉字转拼音

    一.问题描述 汉字转化为对应的拼音或者获取汉字拼音的首字母,这些都是在开发中经常遇到的问题,在获取汉字的拼音或者拼音的首字母之后,我们在推荐或者搜索部门可以很大程度提高用户的体验,比如用户输入"NH",我们就可以联想出"你好"."你会"."年后"."内涵"等词语.在Java中,pinyin4j.jar这个工具很好实现了将汉字转化为对应的拼音,下面我们就介绍下如何使用这个jar包. 二.资源下载 下载之后解压

  • Java汉字转拼音pinyin4j用法详解

    一.工具介绍 pinyin4j 是一个支持将简体和繁体中文转换到成拼音的Java开源类库: 1. 功能 支持同一汉字有多个发音 还支持拼音的格式化输出,比如第几声之类的, 同时支持简体中文.繁体中文转换为拼音-使用起来也非常简单.下面是其官方网址,其中提供了下载: pinyin4j的官方下载地址 2. 目录结构及说明 doc : pinyin4j的api文档 lib : pinyin4j的jar包 src: pinyin4j的源代码 CHANGELOG.txt : pinyin4j的版本更新日志

  • Java中汉字转拼音pinyin4j用法实例分析

    本文实例讲述了Java中汉字转拼音pinyin4j用法.分享给大家供大家参考,具体如下: 汉字转换拼音在日常开发中是个很常见的问题.例如我们伟大的12306,在地名中输入"WH",就会出现"武汉""芜湖""威海"等地名,输入"WUHU"就会出现"芜湖". Java获取汉字的拼音,pinyin4j这个库可以很好的解决这个问题. 下载地址:http://sourceforge.net/pro

  • Java汉字转拼音类库Pinyin4j详细使用方法与实例

    汉字转拼音类库Pinyin4j一般用法 pinyin4j的使用很方便,一般转换只需要使用PinyinHelper类的静态工具方法即可: String[] pinyin = PinyinHelper.toHanyuPinyinStringArray('刘'); //该类还有其他的拼音转换形式,但是基本上用不到,就不介绍了 返回的数组即是该字符的拼音,如上例就是pinyin[0]=liu2,后面的数字代表声调,声调为5表示轻读,无声调.之所谓返回数组,是因为被判定的汉字有可能有多个读音.如果输入的参

  • Java 汉字获取拼音或首字母工具类代码分析

    本文主要介绍Java中,将字符串中的中文转化为拼音,获取汉字串拼音首字母,获取汉字串拼音的工具类,以及相关的示例代码. 1.Maven依赖配置(pom.xml) <dependency> <groupId>com.belerweb</groupId> <artifactId>pinyin4j</artifactId> <version>2.5.1</version> </dependency> 2.工具类代码

  • Java汉字转拼音案例详解

    一.引入Maven依赖 <dependency> <groupId>com.belerweb</groupId> <artifactId>pinyin4j</artifactId> <version>2.5.0</version> </dependency> 二.代码 import com.gyyjy.portal.pojo.cms.sm.SelectTreeVO; import net.sourceforge

  • Java类库BeanUtils组件使用方法及实例详解

    BeanUtils BeanUtils是Apache commens组件里面的成员,由Apache提供的一套开源api,用于简化对javaBean的操作,能够对基本类型自动转换. JavaBean BeanUtils组件是用于简化javaBean的操作,那么什么是javaBean呢?简单来说,javaBean实质就是java类,只不过是遵循了某种规范的java类. javaBean的特点: 必须具有一个无参的构造方法 属性必须私有化 私有化的属性必须通过public类型的方法来暴露,也就是说要出

  • Java时间类库Timer的使用方法与实例详解

    使用 Java 来调度定时任务时,我们经常会使用 Timer 类搞定.Timer 简单易用,在一些业务场景下用来实现简单定时调度. Jave时间类库Timer简单使用 创建Timer对象 编写 自己的 task 类,该类集成 TimerTask,重写 run 方法,把要定时执行的逻辑写在里面 使用 Timer 执行 TimerTask // 5秒后开始执行,每秒执行一次 Timer timer = new Timer(); timer.schedule(new TimerTask() { pub

  • Java数据库操作库DButils类的使用方法与实例详解

    DbUtils是Javar的一个为简化JDBC操作类库 commons-dbutils是Apache组织提供的一个开源JDBC工具类库,它是对JDBC的简单封装,学习成本极低,并且使用dbutils能极大简化jdbc编码的工作量,同时也不会影响程序的性能.因此dbutils成为很多不喜欢hibernate的公司的首选. 整个dbutils总共才3个包: org.apache.commons.dbutils (该包中的类主要帮助我们更便捷的操作JDBC) org.apache.commons.db

  • python GUI库图形界面开发之PyQt5下拉列表框控件QComboBox详细使用方法与实例

    PyQt5下拉列表框控件QComboBox介绍 QComboBox是一个集按钮和下拉选项于一体的控件,也称做下拉列表框 QComboBox类中的常用方法如表 方法 描述 addItem() 添加一个下拉选项 addItems() 从列表中添加下拉选项 Clear() 删除下拉选项集合中的所有选项 count() 返回下拉选项集合中的数目 currentText() 返回选中选项的文本 itemText(i) 获取索引为i的item的选项文本 currentIndex() 返回选中项的索引 set

  • python GUI库图形界面开发之PyQt5输入对话框QInputDialog详细使用方法与实例

    PyQt5输入对话框QInputDialog介绍 QInputDialog控件是一个标准对话框,有一个文本框和两个按钮(ok和cancel)组成,当用户单击ok或enter键后,在父窗口可以收集通过QInputDialog控件输入的信息,QInputDialog控件是QDialog标准对话框的一部分 在QInpuTDialog控件中可以输入数字,字符串或列表中的选项,标签用于提示必要的信息 QInputDialog类中常用的方法 方法 描述 getint() 从控件中获得标准整数输入 getDo

随机推荐