已有101人关注
用JAVA过滤保存为TXT文档的HTML文件的问题
发表在Java图书答疑 2013-11-17
是否精华
版块置顶:
package com.test;

import java.io.BufferedReader;
import java.io.File;
import java.io.FileReader;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class FileTest {

public static void main(String[] args) throws Exception{

File file = new File("E:/heihei1/xiazai.txt");

StringBuilder sb = new StringBuilder();
String s ="";
BufferedReader br = new BufferedReader(new FileReader(file));

while( (s = br.readLine()) != null) {
sb.append(s + "\n");
}

br.close();
String str = sb.toString();

String regEx = "[\\u4e00-\\u9fa5]";
Pattern p = Pattern.compile(regEx);
Matcher m = p.matcher(str);
System.out.print("提取出来的中文有:");
while (m.find()) {
 System.out.print(m.group(0)+" ");
 }
}

}
其中的xiazai.txt文档为抓取的HTML文档,    为什么过滤出的内容不显示,好像是txt文档内容太多了,当自己输入一些文字是还可以滤出来,请问是什么原因,该怎么修改
分享到:
精彩评论 1
无语_mrkj
学分:3155 LV11
2013-11-18
沙发
请问这是哪本书中的哪个实例?
首页上一页 1 下一页尾页 1 条记录 1/1页
手机同步功能介绍
友情提示:以下图书配套资源能够实现手机同步功能
明日微信公众号
明日之星 明日之星编程特训营
客服热线(每日9:00-17:00)
400 675 1066
mingrisoft@mingrisoft.com
吉林省明日科技有限公司Copyright ©2007-2022,mingrisoft.com, All Rights Reserved长春市北湖科技开发区盛北大街3333号长春北湖科技园项目一期A10号楼四、五层
吉ICP备10002740号-2吉公网安备22010202000132经营性网站备案信息 营业执照