小編給大家分享一下java中如何計算文本句子數,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!
創新互聯網絡公司擁有十載的成都網站開發建設經驗,1000+客戶的共同信賴。提供網站設計制作、成都網站設計、網站開發、網站定制、買友情鏈接、建網站、網站搭建、響應式網站建設、網頁設計師打造企業風格,提供周到的售前咨詢和貼心的售后服務
1、任務簡介
本節任務是計算文本中的句子數,并且對于句子數的劃分標準為“。” “!”和“?”三種符號。
2、基本任務和代碼
1)具體思路
(1)首先需要使用InputStreamReader類和BufferedReader類實現文本的讀取,由于我使用的文本文檔均為utf-8編碼,所以還需要指定編碼格式為utf-8;
(2)然后需要定義一個空的字符串變量,在對文本逐行讀出后將讀出的內容追加到該空字符串后;
(3)逐行讀出文檔,然后使用for循環對該行中的每一個字符進行遍歷,使用toString()方法得到每一個字符,再使用if語句和equals()方法字符是否為“。” “!”和“?”三種符號之一,若為其中之一則句子數+1;
(4)將計算得出的句子長度打印出來;
2)任務代碼
程序保存為juzi1.java,代碼如下:
import java.io.*;//導入java.io包中的所有類 import java.util.Scanner;//導入java.util包中的Scanner類 public class juzi1 {//類名 public static void main(String[] args) {//程序主函數 try {//try代碼塊,當發生異常時會轉到catch代碼塊中 //讀取指定的文件 Scanner s = new Scanner(System.in);//創建scanner,控制臺會一直等待輸入,直到敲回車結束 System.out.println("請輸入想要打開的文本文檔:");//輸入提示信息 String a = s.nextLine();//定義字符串變量,并賦值為用戶輸入的信息 //創建類進行文件的讀取,并指定編碼格式為utf-8 InputStreamReader read = new InputStreamReader(new FileInputStream(a),"utf-8"); BufferedReader in = new BufferedReader(read);//可用于讀取指定文件 StringBuffer b = new StringBuffer();//定義一個字符串變量b,便于后續進行內容追加的操作 String str = null;//定義一個字符串類型變量str String d = null;//定義一個字符串類型變量c int e = 0;//定義一個int型變量,用于統計句子數 while((str = in.readLine()) != null) {//readLine()方法, 用于讀取一行,只要讀取內容不為空就一直執行 b.append(str);//將該行內容追加到字符串b的后面 for (int j = 0; j < str.length(); j++) {//for循環的條件,當j小于該行長度時就一直循環并自增 d = Character.toString(str.charAt(j));//返回一個字符串對象 if (d.equals("。")||d.equals("?")||d.equals("!")) {//if語句的條件,判斷是否為句子 e++;//若為一句則e自增一次 } } } in.close();//關閉流 System.out.println("該文本共有"+e+"個句子");//輸出總的句子數 } catch (IOException e) {//當try代碼塊有異常時轉到catch代碼塊 e.printStackTrace();//printStackTrace()方法是打印異常信息在程序中出錯的位置及原因 } } }
3)運行結果
(1)所有文件均保存在路徑D:\demo7下,首先對一個簡單的文本文檔(格式為utf-8)的句子數進行計算,該文本文檔命名為 lsy.txt,內容如下:
從中可以看出該文本文檔中共有4句話,然后在命令行中對程序進行編譯,并運行程序讀取該txt文檔,計算結果如下:
(2)最后在命令行下使用該程序對原版《西游記》txt文檔進行計算,計算結果如下:
由此可以計算得出我使用的《西游記》文檔共含有30804個句子。
以上是“java中如何計算文本句子數”這篇文章的所有內容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內容對大家有所幫助,如果還想學習更多知識,歡迎關注創新互聯行業資訊頻道!