中研院語料庫下載

平衡語料庫(五百萬目詞). 專門針對語言分析而設計的,每個文句都依詞斷開,並標示詞類。語料的蒐集也盡量做到平衡分配在不同的主題和語式上,是現代漢語無窮多的語句中一個代表性的樣本 ... ,中央研究院漢語平衡語料庫」 (簡稱Sini...

中研院語料庫下載

平衡語料庫(五百萬目詞). 專門針對語言分析而設計的,每個文句都依詞斷開,並標示詞類。語料的蒐集也盡量做到平衡分配在不同的主題和語式上,是現代漢語無窮多的語句中一個代表性的樣本 ... ,中央研究院漢語平衡語料庫」 (簡稱Sinica Corpus)第4.0 版,為一包含一千多萬目詞的帶標記平衡語料庫。本語料庫中每個文句都依詞斷開,並標示詞類標記。語料的蒐集也盡量做到平衡分配在不同的主題和語式上,是現代漢語無窮多的語句中一個代表性的樣本。所蒐集的文章為1981 年到2007 年之間的文章,於2010年開始授權申請 ...

相關軟體 Privacy Drive 資訊

Privacy Drive
Privacy Drive 很容易使用加密軟件的個人電腦,使用虛擬磁盤和“飛”磁盤加密技術,不僅鎖定和加密您的數據,而且還隱藏它。無論你想避免窺探 - 照片,視頻,圖形文件,文件,電子表格,甚至整個文件夾。所有的私人信息將被完全保護,以防止未經授權的訪問.即時加密軟件鎖定,隱藏和加密所有類型的圖片,視頻,文件,文件和文件夾,密碼保護您的敏感數據免受未經授權的訪問.使用行業以前的 256 位加密算法... Privacy Drive 軟體介紹

中研院語料庫下載 相關參考資料
下載軟體與資源 - CKIP Lab 中文詞知識庫小組 - 中央研究院

中文斷詞系統(包含未知詞擷取與標記). 簡介 · 線上展示 · 下載 · 商業授權. 中文詞庫-廣義知網. 簡介 · 線上展示 · 下載 · 學術授權(完整版) · 商業授權. 輿情分析系統. 簡介 · 線上展示. 中文剖析系統. 簡介 · 線上展示 · 線上...

http://ckip.iis.sinica.edu.tw

線上系統展示 - CKIP Lab 中文詞知識庫小組 - 中央研究院

平衡語料庫(五百萬目詞). 專門針對語言分析而設計的,每個文句都依詞斷開,並標示詞類。語料的蒐集也盡量做到平衡分配在不同的主題和語式上,是現代漢語無窮多的語句中一個代表性的樣本 ...

http://ckip.iis.sinica.edu.tw

中央研究院平衡語料庫

中央研究院漢語平衡語料庫」 (簡稱Sinica Corpus)第4.0 版,為一包含一千多萬目詞的帶標記平衡語料庫。本語料庫中每個文句都依詞斷開,並標示詞類標記。語料的蒐集也盡量做到平衡分配在不同的主題和語式上,是現代漢語無窮多的語句中一個代表性的樣本。所蒐集的文章為1981 年到2007 年之間的文章,於2010年開始授權申請 ...

http://asbc.iis.sinica.edu.tw

語料庫資源 - 中央研究院

此語料庫之出土文獻語料庫,全部取自史語所漢簡小組所製作的資料庫。 近代漢語標記語料庫. http://www.sinica.edu.tw/Early_Mandarin/. 為應漢語史研究需求而建構的語料庫。目前素語料庫所蒐集的語料已含蓋上古漢語(先秦至西漢)、中古漢語(東漢魏晉南北朝)、近代漢語(唐五代以後)大部分的重要語料,並己陸續開放使用;在標記 ...

http://elearning.ling.sinica.e

自然語言處理-- 語料辭典- 陳鍾誠的網站

http://cc-cedict.org/. XDXF 字典庫— http://xdxf.revdanica.com/down/ · 維基百科:資料下載 — 可作為平行語料庫來源。 ... 山西大學的語料庫: http://www.sxu.edu.cn/homepage/cslab/sxuc1.htm; 臺灣中研院的語料庫:. 現代漢語平衡 ... 國際跨語言仲介語語料庫(ICCI...

http://ccckmit.wikidot.com

中央研究院漢語料庫的內容與說明

當然,作為首次測試中的語料庫,「中研院平衡語料庫」並非完美無缺。特別是詞類. 標記原則,及平衡語料選取原則均是理論上尚無定論且可深入研究的問題。因此也可以由. 學界繼續討論中得到助益而改進的。我們期盼這顆小石頭所牽動的小漣漪,可以更進一步. 推動語言學者的討論,對漢語詞類的分類原則得到更完善的理論與實際 ...

http://lingcorpus.iis.sinica.e

中央研究院-現代漢語標記語料庫

親愛的"中央研究院-現代漢語標記語料庫"用戶您好︰. 系統已經轉移到新的伺服器上,網址為︰ http://lingcorpus.iis.sinica.edu.tw/modern/ 請將"書籤"或"我的最愛"網址更新為此網址謝謝您!

http://app.sinica.edu.tw

中央研究院-現代漢語平衡語料庫Academia Sinica Balanced Corpus of ...

中央研究院現代漢語語料庫」 (簡稱「研究院語料庫」(Sinica Corpus))是專門針對語言分析而設計的,每個文句都依詞斷開,並標示詞類。語料的蒐集也盡量做到現代漢語分配在不同的主題和語式上,是現代漢語無窮多的語句中一個代表性的樣本。 這個語料庫是由中央研究院資訊所、語言所詞庫小組完成的。該小組由陳克健(資訊所)、 ...

http://app.sinica.edu.tw

中文斷詞系統

詞是最小有意義且可以自由使用的語言單位。任何語言處理的系統都必須先能分辨文本中的詞才能進行進一步的處理,例如機器翻譯、語言分析、語言了解、資訊抽取。因此中文自動分詞的工作成了語言處理不可或缺的技術。基本上自動分詞多利用詞典中收錄的詞和文本做比對,找出可能包含的詞,由於存在歧義的切分結果,因此多數的 ...

http://ckipsvr.iis.sinica.edu.

中央研究院漢籍電子文獻

古漢語語料庫, 語言所文獻語料庫研究室資訊所詞庫小組及史語所漢籍全文資料庫計畫, 1,692,394. 臺灣文獻叢刊, 臺史所史籍自動化室, 47,054,208, 原臺灣方志、臺灣檔案及臺灣文獻(一)至(五) 均已合併在此資料庫. 近代史全文資料庫, 近史所, 59,332,639(開放申請版), 自2014年9月24日起歡迎海外人士申請使用近代史全文資料庫.

http://hanji.sinica.edu.tw