java正则匹配读取txt文件提取特定开头和结尾的字符串

目录
  • 前言
  • 一、使用FileInputStream处理
  • 二、使用正则开始匹配
    • 1.匹配规则书写
    • 2.pattern
  • 代码案例
  • 总结

前言

前天刚入职的算法同事,过来问我怎么提取txt文件中的数据,我一看这还不简单,结果…搞了好久。

正则不用真的会忘记,写篇博客增加一下记忆吧。

需求:提取txt文件中,有特定开头(双引号) ,特定结尾(双引号) 的中间的数据,打印出来

一、使用FileInputStream处理

FileInputStream:是java中的字节输入流,就是通过字节的形式进行读取

构造方法 可以通过传递指定打开文件的路径字符串,来创建FileInputStrem对象

new FileInputStrem("文件路径")

InputStremReader 是连接字节流和字符流之间的桥梁,我们通过 new InputStremReader() 的构造方法,传递一个FileInputStrem对象,和一个编码格式,这个编码格式具体根据你要读取文件的编码格式

InputStreamReader(file,"UTF-8");

编码格式可以打开txt文件在右下角查看

// 这里利用了一下小技巧就是 我这个同事给我的文件 每个要提取的数据都在同一行内,所以可以通过每行读取。

        while ((line = br.readLine()) != null) {
            System.out.println(getPatternCode(line,rgex));
        }

二、使用正则开始匹配

1.匹配规则书写

正则表达式匹配规则 这里是以 (ox) 开始 以“ 结尾
这里的第一对括号防止防止转义 所以加了\
然后()表示一个子表达式的开始和结尾 要匹配这两个字符的话 就用上面的\
.表示匹配任意
*表示匹配任意多个
\” 表示匹配最后字符
这里的规则大概就是这样,可以根据需要自己匹配

String rgex = "\\(0x\\)(.*?)\"";

2.pattern

pattern是正则表达式的编译形式 匹配的模式
Pattern.compile 是获取Pattern实例,Pattern的构造器是私有的,只能通过compile方法获取

Pattern pattern = Pattern.compile(rgex);

matcher类也是私有的,只能通过pattern.matcher来创建,
构造方法传递一个参数时,返回一个matcher实例,是匹配上的字符串
构造方法传递两个参数时,返回一个boolean值,表示是否匹配上指定的字符串

Matcher m = pattern.matcher(string);

m.find() 是部分匹配,
从给定的字符串开始匹配,第一次匹配到之后 如果没有重置,则会从上次匹配到的最后一个字符的下一位开始往后匹配
匹配成功后会返回 true

m.find()

m.group() 是返回匹配的数据
group(0) 是返回原始匹配的数据
group(1) 是返回第一次匹配到的数据

m.group(1);

代码案例

package fileOperation;

import java.io.*;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

/**
 * @program: solution
 * @description: 读取文件 利用正则表达式筛选数据
 * @author: Wang Hai Xin
 * @create: 2022-10-24 18:52
 **/
public class txtFiltration {

    public static void main(String[] args) throws IOException {
        /**/
        FileInputStream file = new FileInputStream("C:\\project\\solution\\src\\main\\java\\fileOperation\\djk-Log 2022-10-21 17_48_06.txt");
        /*指定文件类型*/
        InputStreamReader isr = new InputStreamReader(file, "UTF-8");

        BufferedReader br = new BufferedReader(isr);

        /*匹配规则*/
        String rgex = "\\(0x\\)(.*?)\"";

        String line = null;
        while ((line = br.readLine()) != null) {
            System.out.println(getPatternCode(line,rgex));
        }
    }

    public static String getPatternCode(String string, String rgex){
        // 匹配的模式
        Pattern pattern = Pattern.compile(rgex);
        Matcher m = pattern.matcher(string);
        while (m.find()) {
            return m.group(1);
        }
        return null;
    }
}

效果展示,直接将结果从控制台复制使用即可

注意:控制台展示的数目有限,如果出现前半部分丢失, 可能是控制台展示的数据达到上限,可以通过输出到指定文件或者exel文件中

总结

到此这篇关于java正则匹配读取txt文件提取特定开头和结尾的字符串的文章就介绍到这了,更多相关java提取txt文件中指定内容内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • JAVA中的字符串常量池使用操作代码

    目录 前言 理解字符串常量池 字符串拼接方式 妙用String.intern() 方法 字符串常量池有多大? 字符串常量池的优缺点 字符串池的优点 字符串池的缺点 总结 前言 研究表明,Java堆中对象占据最大比重的就是字符串对象,所以弄清楚字符串知识很重要,本文主要重点聊聊字符串常量池.Java中的字符串常量池是Java堆中的一块特殊存储区域,用于存储字符串.它的实现是为了提高字符串操作的性能并节省内存.它也被称为String Intern Pool或String Constant Pool.

  • Java计算字符串公式的方式解读

    目录 如何计算字符串公式 解决方案一 解决方案二 总结 如何计算字符串公式 解决方案一 使用 commons-jexl3 jar 包 可以使用 commons-jexl3 jar包,此 jar 包提供了一些方法用于计算字符串中的公式. maven 依赖如下: <dependency>     <groupId>org.apache.commons</groupId>     <artifactId>commons-jexl3</artifactId&g

  • Java 常量池详解之字符串常量池实现代码

    目录 1.字符串常量池(String Constant Pool) 1.1:字符串常量池在Java内存区域的哪个位置? 1.2:字符串常量池是什么? 1.3 字符串常量池生成的时机? 如何将String对象放入到常量池 String 对象代码案例解析 new string(“abc”)创建了几个对象 解析public native String intern() 方法 Integer 对象代码案例解析 为啥Integer i1 =10 跟Integer.valueOf(10) 是相等的? 为啥I

  • Java字符串split方法的坑及解决

    目录 Java字符串split方法的坑 Java字符串split方法的探究 总结 Java字符串split方法的坑 先来看几行简单的Java代码,如下: System.out.println("1,2".split(",").length); System.out.println("1,2,".split(",").length); System.out.println("".split(",&q

  • java正则匹配读取txt文件提取特定开头和结尾的字符串

    目录 前言 一.使用FileInputStream处理 二.使用正则开始匹配 1.匹配规则书写 2.pattern 代码案例 总结 前言 前天刚入职的算法同事,过来问我怎么提取txt文件中的数据,我一看这还不简单,结果…搞了好久. 正则不用真的会忘记,写篇博客增加一下记忆吧. 需求:提取txt文件中,有特定开头(双引号) ,特定结尾(双引号) 的中间的数据,打印出来 一.使用FileInputStream处理 FileInputStream:是java中的字节输入流,就是通过字节的形式进行读取

  • python读取txt文件中特定位置字符的方法

    如下所示: # -*- coding:utf-8 -*- import sys reload(sys) sys.setdefaultencoding('utf8') fp = open("resources.txt", "r") sample = fp.readlines() file=open("test.txt", "w") for line in sample: sample_ = line.split('固定字符')

  • Java如何实现读取txt文件内容并生成Word文档

    目录 导入Jar包 1. Maven仓库下载导入 2. 手动导入 读取txt生成Word 注意事项 本文将以Java程序代码为例介绍如何读取txt文件中的内容,生成Word文档.在编辑代码前,可参考如下代码环境进行配置: IntelliJ IDEA Free Spire.Doc for Java Txt文档 导入Jar包 两种方法可在Java程序中导入jar文件 1. Maven仓库下载导入 在pom.xml中配置如下: <repositories> <repository> &l

  • java实现读取txt文件并以在每行以空格取数据

    简单一个例子.其中正则是取消多余空格或者tab键 package test4; import java.io.BufferedReader; import java.io.FileReader; import java.io.IOException; public class ExplaceSql { public static void main(String[] args) { String filePath = ExplaceSql.class.getResource("").g

  • Java读取txt文件和写入txt文件的简单实例

    写Java程序时经常碰到要读如txt或写入txt文件的情况,但是由于要定义好多变量,经常记不住,每次都要查,特此整理一下,简单易用,方便好懂! package edu.thu.keyword.test; import java.io.File; import java.io.InputStreamReader; import java.io.BufferedReader; import java.io.BufferedWriter; import java.io.FileInputStream;

  • java实现读取txt文件中的内容

    我们先来看个例子 import java.io.*; /** * Created by liguoqing on 2016/3/28. */ public class ReadTxtFile { public static void readTxt(String filePath) { try { File file = new File(filePath); if(file.isFile() && file.exists()) { InputStreamReader isr = new

  • java读取txt文件代码片段

    本文实例为大家分享了java读取txt文件的具体代码,供大家参考,具体内容如下 学习小记: 1.首先要根据路径获取你的 txt 文本文件.File file = new File(path); 2.将获取到的这个字节码流读进缓存.new FileInputStream(file) ; 3.然后对刚才读进缓存的输入流进行解读,生成对应字节流.InputStreamReader(readIn) 4.再然后通过 BufferedReader 这个类进行一行一行的输出.bufferedReader.re

  • Java读取txt文件的方法

    java读取txt文件内容.可以作如下理解: 首先获得一个文件句柄.File file = new File(); file即为文件句柄.两人之间连通电话网络了.接下来可以开始打电话了. 通过这条线路读取甲方的信息:new FileInputStream(file) 目前这个信息已经读进来内存当中了.接下来需要解读成乙方可以理解的东西 既然你使用了FileInputStream().那么对应的需要使用InputStreamReader()这个方法进行解读刚才装进来内存当中的数据 解读完成后要输出

  • Java读取TXT文件内容的方法

    Java读取txt文件内容.可以作如下理解: 首先获得一个文件句柄.File file = new File(); file即为文件句柄.两人之间连通电话网络了.接下来可以开始打电话了. 通过这条线路读取甲方的信息:new FileInputStream(file) 目前这个信息已经读进来内存当中了.接下来需要解读成乙方可以理解的东西 既然你使用了FileInputStream().那么对应的需要使用InputStreamReader()这个方法进行解读刚才装进来内存当中的数据 解读完成后要输出

  • Java读取txt文件中的数据赋给String变量方法

    实例如下所示: public class MainActivity { private static final String fileName = "D:/Tao/MyEclipseWorkspace/resources/weather.txt"; public static void main(String[] args) { //读取文件 BufferedReader br = null; StringBuffer sb = null; try { br = new Buffer

随机推荐