Java 实现汉字转换为拼音的实例

Java 实现汉字转换为拼音

转换类

public class PINYINChinese {
  private static int[] pyvalue = new int[] { -20319, -20317, -20304, -20295,
      -20292, -20283, -20265, -20257, -20242, -20230, -20051, -20036,
      -20032, -20026, -20002, -19990, -19986, -19982, -19976, -19805,
      -19784, -19775, -19774, -19763, -19756, -19751, -19746, -19741,
      -19739, -19728, -19725, -19715, -19540, -19531, -19525, -19515,
      -19500, -19484, -19479, -19467, -19289, -19288, -19281, -19275,
      -19270, -19263, -19261, -19249, -19243, -19242, -19238, -19235,
      -19227, -19224, -19218, -19212, -19038, -19023, -19018, -19006,
      -19003, -18996, -18977, -18961, -18952, -18783, -18774, -18773,
      -18763, -18756, -18741, -18735, -18731, -18722, -18710, -18697,
      -18696, -18526, -18518, -18501, -18490, -18478, -18463, -18448,
      -18447, -18446, -18239, -18237, -18231, -18220, -18211, -18201,
      -18184, -18183, -18181, -18012, -17997, -17988, -17970, -17964,
      -17961, -17950, -17947, -17931, -17928, -17922, -17759, -17752,
      -17733, -17730, -17721, -17703, -17701, -17697, -17692, -17683,
      -17676, -17496, -17487, -17482, -17468, -17454, -17433, -17427,
      -17417, -17202, -17185, -16983, -16970, -16942, -16915, -16733,
      -16708, -16706, -16689, -16664, -16657, -16647, -16474, -16470,
      -16465, -16459, -16452, -16448, -16433, -16429, -16427, -16423,
      -16419, -16412, -16407, -16403, -16401, -16393, -16220, -16216,
      -16212, -16205, -16202, -16187, -16180, -16171, -16169, -16158,
      -16155, -15959, -15958, -15944, -15933, -15920, -15915, -15903,
      -15889, -15878, -15707, -15701, -15681, -15667, -15661, -15659,
      -15652, -15640, -15631, -15625, -15454, -15448, -15436, -15435,
      -15419, -15416, -15408, -15394, -15385, -15377, -15375, -15369,
      -15363, -15362, -15183, -15180, -15165, -15158, -15153, -15150,
      -15149, -15144, -15143, -15141, -15140, -15139, -15128, -15121,
      -15119, -15117, -15110, -15109, -14941, -14937, -14933, -14930,
      -14929, -14928, -14926, -14922, -14921, -14914, -14908, -14902,
      -14894, -14889, -14882, -14873, -14871, -14857, -14678, -14674,
      -14670, -14668, -14663, -14654, -14645, -14630, -14594, -14429,
      -14407, -14399, -14384, -14379, -14368, -14355, -14353, -14345,
      -14170, -14159, -14151, -14149, -14145, -14140, -14137, -14135,
      -14125, -14123, -14122, -14112, -14109, -14099, -14097, -14094,
      -14092, -14090, -14087, -14083, -13917, -13914, -13910, -13907,
      -13906, -13905, -13896, -13894, -13878, -13870, -13859, -13847,
      -13831, -13658, -13611, -13601, -13406, -13404, -13400, -13398,
      -13395, -13391, -13387, -13383, -13367, -13359, -13356, -13343,
      -13340, -13329, -13326, -13318, -13147, -13138, -13120, -13107,
      -13096, -13095, -13091, -13076, -13068, -13063, -13060, -12888,
      -12875, -12871, -12860, -12858, -12852, -12849, -12838, -12831,
      -12829, -12812, -12802, -12607, -12597, -12594, -12585, -12556,
      -12359, -12346, -12320, -12300, -12120, -12099, -12089, -12074,
      -12067, -12058, -12039, -11867, -11861, -11847, -11831, -11798,
      -11781, -11604, -11589, -11536, -11358, -11340, -11339, -11324,
      -11303, -11097, -11077, -11067, -11055, -11052, -11045, -11041,
      -11038, -11024, -11020, -11019, -11018, -11014, -10838, -10832,
      -10815, -10800, -10790, -10780, -10764, -10587, -10544, -10533,
      -10519, -10331, -10329, -10328, -10322, -10315, -10309, -10307,
      -10296, -10281, -10274, -10270, -10262, -10260, -10256, -10254 };
  public static String[] pystr = new String[] { "a", "ai", "an", "ang", "ao",
      "ba", "bai", "ban", "bang", "bao", "bei", "ben", "beng", "bi",
      "bian", "biao", "bie", "bin", "bing", "bo", "bu", "ca", "cai",
      "can", "cang", "cao", "ce", "ceng", "cha", "chai", "chan", "chang",
      "chao", "che", "chen", "cheng", "chi", "chong", "chou", "chu",
      "chuai", "chuan", "chuang", "chui", "chun", "chuo", "ci", "cong",
      "cou", "cu", "cuan", "cui", "cun", "cuo", "da", "dai", "dan",
      "dang", "dao", "de", "deng", "di", "dian", "diao", "die", "ding",
      "diu", "dong", "dou", "du", "duan", "dui", "dun", "duo", "e", "en",
      "er", "fa", "fan", "fang", "fei", "fen", "feng", "fo", "fou", "fu",
      "ga", "gai", "gan", "gang", "gao", "ge", "gei", "gen", "geng",
      "gong", "gou", "gu", "gua", "guai", "guan", "guang", "gui", "gun",
      "guo", "ha", "hai", "han", "hang", "hao", "he", "hei", "hen",
      "heng", "hong", "hou", "hu", "hua", "huai", "huan", "huang", "hui",
      "hun", "huo", "ji", "jia", "jian", "jiang", "jiao", "jie", "jin",
      "jing", "jiong", "jiu", "ju", "juan", "jue", "jun", "ka", "kai",
      "kan", "kang", "kao", "ke", "ken", "keng", "kong", "kou", "ku",
      "kua", "kuai", "kuan", "kuang", "kui", "kun", "kuo", "la", "lai",
      "lan", "lang", "lao", "le", "lei", "leng", "li", "lia", "lian",
      "liang", "liao", "lie", "lin", "ling", "liu", "long", "lou", "lu",
      "lv", "luan", "lue", "lun", "luo", "ma", "mai", "man", "mang",
      "mao", "me", "mei", "men", "meng", "mi", "mian", "miao", "mie",
      "min", "ming", "miu", "mo", "mou", "mu", "na", "nai", "nan",
      "nang", "nao", "ne", "nei", "nen", "neng", "ni", "nian", "niang",
      "niao", "nie", "nin", "ning", "niu", "nong", "nu", "nv", "nuan",
      "nue", "nuo", "o", "ou", "pa", "pai", "pan", "pang", "pao", "pei",
      "pen", "peng", "pi", "pian", "piao", "pie", "pin", "ping", "po",
      "pu", "qi", "qia", "qian", "qiang", "qiao", "qie", "qin", "qing",
      "qiong", "qiu", "qu", "quan", "que", "qun", "ran", "rang", "rao",
      "re", "ren", "reng", "ri", "rong", "rou", "ru", "ruan", "rui",
      "run", "ruo", "sa", "sai", "san", "sang", "sao", "se", "sen",
      "seng", "sha", "shai", "shan", "shang", "shao", "she", "shen",
      "sheng", "shi", "shou", "shu", "shua", "shuai", "shuan", "shuang",
      "shui", "shun", "shuo", "si", "song", "sou", "su", "suan", "sui",
      "sun", "suo", "ta", "tai", "tan", "tang", "tao", "te", "teng",
      "ti", "tian", "tiao", "tie", "ting", "tong", "tou", "tu", "tuan",
      "tui", "tun", "tuo", "wa", "wai", "wan", "wang", "wei", "wen",
      "weng", "wo", "wu", "xi", "xia", "xian", "xiang", "xiao", "xie",
      "xin", "xing", "xiong", "xiu", "xu", "xuan", "xue", "xun", "ya",
      "yan", "yang", "yao", "ye", "yi", "yin", "ying", "yo", "yong",
      "you", "yu", "yuan", "yue", "yun", "za", "zai", "zan", "zang",
      "zao", "ze", "zei", "zen", "zeng", "zha", "zhai", "zhan", "zhang",
      "zhao", "zhe", "zhen", "zheng", "zhi", "zhong", "zhou", "zhu",
      "zhua", "zhuai", "zhuan", "zhuang", "zhui", "zhun", "zhuo", "zi",
      "zong", "zou", "zu", "zuan", "zui", "zun", "zuo" };
  private StringBuilder buffer;
  private String resource;
  private static CharacterParser characterParser = new CharacterParser();

  public static CharacterParser getInstance() {
    return characterParser;
  }

  public String getResource() {
    return resource;
  }

  public void setResource(String resource) {
    this.resource = resource;
  }

  /** * 汉字转成ASCII* * */
  private int getChsAscii(String chs) {
    int asc = 0;
    try {
      byte[] bytes = chs.getBytes("gb2312");
      if (bytes == null || bytes.length > 2 || bytes.length <= 0) {
        throw new RuntimeException("illegal resource string");
      }
      if (bytes.length == 1) {
        asc = bytes[0];
      }
      if (bytes.length == 2) {
        int hightByte = 256 + bytes[0];
        int lowByte = 256 + bytes[1];
        asc = (256 * hightByte + lowByte) - 256 * 256;
      }
    } catch (Exception e) {
      System.out
          .println("ERROR:ChineseSpelling.class-getChsAscii(String chs)"
              + e);
    }
    return asc;
  }

  /** * 单字解析 * * */
  public String convert(String str) {
    String result = null;
    int ascii = getChsAscii(str);
    if (ascii > 0 && ascii < 160) {
      result = String.valueOf((char) ascii);
    } else {
      for (int i = (pyvalue.length - 1); i >= 0; i--) {
        if (pyvalue[i] <= ascii) {
          result = pystr[i];
          break;
        }
      }
    }
    return result;
  }

  /** * 词组解析 * * */
  public String getSelling(String chs) {
    String key, value;
    buffer = new StringBuilder();
    for (int i = 0; i < chs.length(); i++) {
      key = chs.substring(i, i + 1);
      if (key.getBytes().length >= 2) {
        value = (String) convert(key);
        if (value == null) {
          value = "unknown";
        }
      } else {
        value = key;
      }
      buffer.append(value);
    }
    return buffer.toString();
  }

  public String getSpelling() {
    return this.getSelling(this.getResource());
  }

}

实现

String country="汉字";
 public String getString() {
    //返回拼音
    return PINYINChinese.getInstance().getSelling(country);
  }

感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!

(0)

相关推荐

  • java中将汉字转换成拼音的实现代码

    一:演示:       如在控制台输入:北京欢迎你 打印出来的拼音:bei jing huan ying ni 二:导入要依赖的jar: 汉字转换拼音jar下载 三:代码编写 复制代码 代码如下: public static String getPinYin(String src) {         char[] t1 = null;         t1 = src.toCharArray();          // System.out.println(t1.length);      

  • java中实现汉字按照拼音排序(示例代码)

    最近項目中需要對繁體字按拼音進行排序 复制代码 代码如下: public static void main(String[] args) { Comparator cmp = Collator.getInstance(java.util.Locale.CHINA); String[] arr = { "张三", "李四", "王五", "刘六" ,"周濤","戴笠","戴阿&q

  • Java实现将汉字转化为汉语拼音的方法

    本文实例讲述了Java实现将汉字转化为汉语拼音的方法.分享给大家供大家参考,具体如下: 网上乱转,偶然看到一个很有意思的小工具,名字叫pinyin4j,可以把汉字转换为汉语拼音,利用他的话再配合上lucene.中文分词就可以做出类似google那种输入汉语拼音进行全文检索的功能了.实现的代码如下 package pinyin4j; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin4j.forma

  • java实现将汉语转换为拼音功能

    这几天在做项目的时候用到了通过拼音去数据库表里面去模糊查询汉语字段,刚开始的时候感觉特别神奇,查了好多资料,直接去模糊查询是能实现的,但是貌似很复杂.所以最终取了一个比较容易的方案,就是给数据库表里面新加了一个拼音字段.完美的解决了这个问题,虽说可以这么干,但是数据这么多,全部转换为拼音(人一个一个区输入,有点不现实).于是就在网上找呀找,就找到了一段直接将汉语转换为拼音的一段代码,在这和大家分享一下. 所需jar:pinyin4j-2.5.0.jar public static void ma

  • Java汉字转成汉语拼音工具类

    Java汉字转成汉语拼音工具类,需要用到pinyin4j.jar包. import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType; import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat; import net.sourceforge.pinyin4j.format.HanyuP

  • Java中汉字转拼音pinyin4j用法实例分析

    本文实例讲述了Java中汉字转拼音pinyin4j用法.分享给大家供大家参考,具体如下: 汉字转换拼音在日常开发中是个很常见的问题.例如我们伟大的12306,在地名中输入"WH",就会出现"武汉""芜湖""威海"等地名,输入"WUHU"就会出现"芜湖". Java获取汉字的拼音,pinyin4j这个库可以很好的解决这个问题. 下载地址:http://sourceforge.net/pro

  • java获取中文拼音首字母的实例

    如下所示: import net.sourceforge.pinyin4j.PinyinHelper; public class PinyinHelperUtil { /** * 得到中文首字母(中国 -> ZG) * @param str 需要转化的中文字符串 * @return 大写首字母缩写的字符串 */ public static String getPinYinHeadChar(String str) { StringBuilder convert = new StringBuilde

  • Java获取汉字对应的拼音(全拼或首字母)

    Java 根据汉语字符串获得对应的拼音字符串或者拼音首字母字符串等操作,需要添加jar包: 引入pinyin4j-2.5.0.jar包 代码实现: import java.util.regex.Matcher; import java.util.regex.Pattern; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat; im

  • java随机生成一个名字和对应拼音的方法

    本文实例讲述了java随机生成一个名字和对应拼音的方法.分享给大家供大家参考.具体如下: package com.cn.wangk.util.name; import java.util.Random; import com.cn.wangk.util.StrTools; public class ChineseName { String[] sName = new String[95]; String[] Name = new String[79]; private String Names;

  • Java获取中文拼音、中文首字母缩写和中文首字母的示例

    我们有时候会遇到这样的情况,需要获取某些中文的拼音.中文首字母缩写和中文首字母,下面我将为大家介绍一下如何获取中文拼音的缩写. 1.项目建立和配置 首先,我们建立一个Java项目,新建libs文件夹并引入一个734a7099-4830-39f2-a136-0e850ccdcc7a.jar文件,这个步骤相信就不用详细写了,跳过. 2.获取中文拼音(如:广东省 -->guangdongsheng) </pre><pre name="code" class="

  • Java实现的汉语拼音工具类完整实例

    本文实例讲述了Java实现的汉语拼音工具类.分享给大家供大家参考,具体如下: package test; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType; import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat; import net.sourceforge.piny

随机推荐