人文及社會科學集刊
logo-人文及社會科學集刊

人文及社會科學集刊
logo_m-人文及社會科學集刊

    跳至中央區塊/Main Content :::
  • 期刊簡介
    • 期刊簡介
    • 訂閱辦法
    • 與我們聯絡
  • 編輯委員會
  • 卷期目次
    • 即將刊登論文
  • 資料庫收錄
  • 投稿須知
    • 撰稿用例
  • 線上投稿
  • 人社中心
EN
人社中心
search
人文及社會科學集刊
  • Home
  • 卷期目次
  • 《人文及社會科學集刊》 第 27卷第 04 期
  • Facebook
  • line
  • email
  • Twitter
  • Print
2015年12月 27卷4期
社會科學研究中的文字探勘應用:以文意為基礎的文件分類及其問題 
發刊日期/Published Date
2015年12月
中英文篇名/Title
社會科學研究中的文字探勘應用:以文意為基礎的文件分類及其問題 
Text Mining for Social Studies: Meaning-based Document Classification and Its Problems
論文屬性/Type
研究論文 Research Article
作者/Author
陳世榮
Roger S. Chen
頁碼/Pagination
683-718
摘要/Abstract

隨著電子典藏技術的精進,文字探勘技術逐漸受到重視,本文以社會科學研究在文意區別上的需求,評估監督式機器學習對非結構、複雜文本的分類效果,並就所見問題提出分析與建議。本文從文字探勘與內容分析文意區別上的差異與共通性出發,繼而以新聞報導為分析資料,針就特定文件意向,遵循一般文字探勘程序,以支持向量機與簡易貝式分類器執行文件分類評估。分析結果指出,文字探勘對於複雜文意的判讀效果值得肯定,但經由共詞網絡分析也發現,文件的編撰風格將影響文件分類的效果。建議研究者在資料處理初期,應反覆評估研究目的、資料特性與分類器模型間的契合度。

Along with the growing development of electronic information storage, text mining has increasingly gained attention from scholars and practitioners across various disciplines. In response to the need for meaning differentiation in social studies, the study aims to evaluate supervised machine learning classifiers in terms of the performance of document classification. Setting out from the comparison between traditional content analysis and text mining, the evaluation follows a normal procedure of text mining and applies Support Vector Machine and Naïve Bayes classifiers on non-structural, complex social texts extracted from news media. The outcomes of the analysis validate that text mining manages classification well for documents with complex meaning. However, a further coword network analysis in the study finds that the editing style of data may affect classifiers’ performance. It is suggested that, in the early stage of data processing, greater care must be given to the fit between research problems, editing styles, and classifiers.

關鍵字/Keyword
文字探勘, 文意區別, 文件分類, 機器學習, 共詞網絡分析
text mining, meaning differentiation, document classification, machine learning, co-word network analysis
學科分類/Subject
政治學
Political Science
主題分類/Theme

DOI
檔案下載/Download
摘要 全文下載
相關文章
  • 土地稅制須逆向改革
  • 評論
  • 組織績效與結構存續的因果連結
  • 出口自動設限對出口廠商的影響
  • 組織結構的完形設計

  • 期刊簡介
  • 編輯委員會
  • 卷期目次
  • 資料庫收錄
  • 投稿須知
  • 線上投稿

115臺北市南港區研究院路二段128號 中央研究院人文社會科學研究中心

Tel: 02-27898156 Fax: 02-27898157 Email: issppub@sinica.edu.tw

© Copyright 2025. RCHSS Sinica All Rights Reserved.隱私權及安全政策版號:V1.1.2