java吧 关注:1,237,666贴子:12,708,043
  • 6回复贴,共1

举手提问贴

只看楼主收藏回复

这是一个统计txt文档中汉字字数的程序
疑问一:我是按照Unicode写的正则表达式,为何非要用“gbk”才能统计出来,用“Unicode”则算出来是0
疑问二:这样统计出来的都把第一行的忽略了?这是什么原因啊?
望好心人帮忙解答


IP属地:湖南来自Android客户端1楼2015-11-05 10:13回复
    第二个问题已经自己解决了


    IP属地:湖南来自Android客户端3楼2015-11-05 10:44
    回复
      第二个问题可以答复你。。。
      循环外取了一行啦。。。


      4楼2015-11-05 10:58
      收起回复
        第一个问题在于,你的文件就是gbk编码。你用其他方式或者默认的话,会取你myeclipse的编码,然后读进来的都是乱码,unicode怎么可能匹配到字符。。不信你读一行就打印一行看看


        IP属地:江苏5楼2015-11-05 11:29
        收起回复