HOME 首页
SERVICE 服务产品
XINMEITI 新媒体代运营
CASE 服务案例
NEWS 热点资讯
ABOUT 关于我们
CONTACT 联系我们
创意岭
让品牌有温度、有情感
专注品牌策划15年

    keyword提取(提取word文档中的一些文字)

    发布时间:2023-04-08 01:25:37     稿源: 创意岭    阅读: 119        

    大家好!今天让创意岭的小编来大家介绍下关于keyword提取的问题,以下是小编对此问题的归纳整理,让我们一起来看看吧。

    开始之前先推荐一个非常厉害的Ai人工智能工具,一键生成原创文章、方案、文案、工作计划、工作报告、论文、代码、作文、做题和对话答疑等等

    只需要输入关键词,就能返回你想要的内容,越精准,写出的就越详细,有微信小程序端、在线网页版、PC客户端

    官网:https://ai.de1919.com

    创意岭作为行业内优秀的企业,服务客户遍布全球各地,如需了解SEO相关业务请拨打电话175-8598-2043,或添加微信:1454722008

    本文目录:

    keyword提取(提取word文档中的一些文字)

    一、提取Java关键字

    我写了个Keywords.java类,代码如下:

    *************************************************************

    import java.awt.BorderLayout;

    import java.awt.Dimension;

    import java.awt.FlowLayout;

    import java.awt.GridLayout;

    import java.awt.Toolkit;

    import java.awt.event.ActionEvent;

    import java.awt.event.ActionListener;

    import java.io.BufferedReader;

    import java.io.File;

    import java.io.FileNotFoundException;

    import java.io.FileReader;

    import java.io.IOException;

    import java.util.StringTokenizer;

    import javax.swing.BorderFactory;

    import javax.swing.JButton;

    import javax.swing.JFileChooser;

    import javax.swing.JFrame;

    import javax.swing.JPanel;

    import javax.swing.JScrollPane;

    import javax.swing.JTextArea;

    import javax.swing.UIManager;

    public class Keywords extends JFrame {

    String[] keywords = { "abstract", "boolean", "break", "byte", "case",

    "catch", "char", "class", "continue", "default", "do", "double",

    "else", "extends", "false", "final", "finally", "float", "for",

    "if", "implements", "import", "instanceof", "int", "interface",

    "long", "native", "new", "null", "package", "private", "protected",

    "public", "return", "short", "static", "super", "switch",

    "synchronized", "this", "throw", "throws", "transient", "true",

    "try", "void", "volatile", "while", "const", "goto" };

    JTextArea text;

    JTextArea result;

    public Keywords() {

    this.setTitle("计算关键字数");

    // 文本框

    text = new JTextArea(6, 50);

    text.setLineWrap(true);

    JScrollPane textScroll = new JScrollPane(text);

    text.setBorder(BorderFactory.createBevelBorder(1));

    JPanel textPanel = new JPanel(new BorderLayout());

    textPanel.setBorder(BorderFactory.createTitledBorder("导入的文本"));

    textPanel.add(textScroll);

    // 结果框

    result = new JTextArea(6, 50);

    result.setLineWrap(true);

    JScrollPane resultScroll = new JScrollPane(result);

    result.setBorder(BorderFactory.createBevelBorder(1));

    JPanel resultPanel = new JPanel(new BorderLayout());

    resultPanel.setBorder(BorderFactory.createTitledBorder("计算结果"));

    resultPanel.add(resultScroll);

    // 导入文本和结果框

    JPanel allPanel = new JPanel();

    allPanel.setLayout(new GridLayout(2, 1));

    allPanel.add(textPanel);

    allPanel.add(resultPanel);

    // 按钮

    JButton impButton = new JButton("导入文本");

    JButton calcButton = new JButton("计算关键字数");

    JPanel buttonPanel = new JPanel(new FlowLayout());

    buttonPanel.add(impButton);

    buttonPanel.add(calcButton);

    // 添加

    this.add(allPanel, BorderLayout.CENTER);

    this.add(buttonPanel, BorderLayout.SOUTH);

    // this.setSize(400, 300);

    this.pack();

    Toolkit tool = Toolkit.getDefaultToolkit();

    Dimension screen = tool.getScreenSize();

    this.setLocation(screen.width / 2 - this.getWidth() / 2, screen.height

    / 2 - this.getHeight() / 2);

    this.setVisible(true);

    this.setDefaultCloseOperation(JFrame.EXIT_ON_CLOSE);

    // 导入文本

    impButton.addActionListener(new ActionListener() {

    public void actionPerformed(ActionEvent e) {

    writeText();

    }

    });

    // 计算关键字数

    calcButton.addActionListener(new ActionListener() {

    public void actionPerformed(ActionEvent e) {

    // for(String ss : s) {

    // System.out.println(ss);

    // }

    String[] start = text.getText().trim().split("n");

    System.out.println("start: " + start.length);

    // String[] rets = new String[start.length];

    StringBuffer ret = new StringBuffer();

    for (int i = 0; i < start.length; i++) {

    StringTokenizer st = new StringTokenizer(start[i]);

    int n = 0;

    while (st.hasMoreTokens()) {

    String comp = st.nextToken();

    for (String s : keywords) {

    if (s.equals(comp)) {

    n++;

    if (n == 1) {

    ret.append(i + ": ");

    ret.append(s);

    } else {

    ret.append(", " + s);

    }

    }

    }

    }

    if (n != 0) {

    ret.append("n");

    }

    }

    result.setText(ret.toString().trim());

    }

    });

    }

    // 导入文本

    public void writeText() {

    try {

    JFileChooser chooser = new JFileChooser();

    chooser.showOpenDialog(this);

    File file = chooser.getSelectedFile();

    BufferedReader br = new BufferedReader(new FileReader(file));

    String s;

    text.setText("");

    while ((s = br.readLine()) != null) {

    text.append(s + "n");

    }

    text.setText(text.getText().trim());

    System.out.println(text.getText());

    } catch (FileNotFoundException e) {

    e.printStackTrace();

    } catch (IOException e2) {

    e2.printStackTrace();

    }

    }

    public static void main(String[] args) throws Exception {

    UIManager.setLookAndFeel(UIManager.getSystemLookAndFeelClassName());

    new Keywords();

    }

    }

    *************************************************************

    运行结果如下:

    keyword提取(提取word文档中的一些文字)

    二、excel如何提取所需关键字所在行?

    如果是2020版office,提供一个筛选函数,如果包含多条记录都可筛选出,公式只需放在左上角,只要注意可能需要占用的其他单元格是空白即可,否则会显示#SPILL! 错误

    假设需要的数据C-H列(作为查询表,不要用合并单元格,否则只显示第一行,因为被合并的行数据内容是空白,不会被查到),另外如果跨表不要忘了引用前面的表名(例如“表!D:D”)

    =FILTER(C:H,D:D="止动螺栓","未找到")

    三、Excel怎么通过关键字,把备注信息里面的关键字提取出来??

    keyword提取(提取word文档中的一些文字)

    =MID(A6,FIND("(",A6,1)+1,FIND(",",A6,1)-FIND("(",A6,1)-1)

    这是公式  是这个效果吧

    四、java word中提取关键字

    给个思路吧。

    读取word用doc4j,然后就是读成字符串进行处理了。

    提取关键字首先是中文分词技术,就是把一段话划分成多个组成的词语,然后统计词语的出现次数,这个是主要依据。这个是有实现的jar包的,可以去baidu搜,搜java 中文分词就行。

    分词之后,记录词语出现位置,这个是辅助的依据,记录词语一句话中的位置,越靠前越像关键字,权重越高。

    甚至可能需要建立一个权重体系,次数设置一个权重,整体位置设置一个权重,不同位置权重也不同。不了解权重可以理解成系数(百分比的,然后计算那个词是关键词)。

    同时需要注意,可能需要排除一些常用词,哪些次需要排除,这个需要根据程序反复运行,读取不同word文章的结果来定。

    不明白的话在问吧。

    以上就是关于keyword提取相关问题的回答。希望能帮到你,如有更多相关问题,您也可以联系我们的客服进行咨询,客服也会为您讲解更多精彩的知识和内容。


    推荐阅读:

    key劲能液(key劲能液官网)

    okpay钱包苹果版(okex钱包ios)

    heaskedhertogoto

    在线logo免费设计(在线设计logo商标免费)_2

    住房室内设计效果图(住房室内设计效果图大全)