기관회원 [로그인]
소속기관에서 받은 아이디, 비밀번호를 입력해 주세요.
개인회원 [로그인]

비회원 구매시 입력하신 핸드폰번호를 입력해 주세요.
본인 인증 후 구매내역을 확인하실 수 있습니다.

회원가입
서지반출
문서 유사도 기법을 활용한 이슈 키워드 추출 방법 - 인터넷 뉴스 기사를 대상으로 -
[STEP1]서지반출 형식 선택
파일형식
@
서지도구
SNS
기타
[STEP2]서지반출 정보 선택
  • 제목
  • URL
돌아가기
확인
취소
  • 문서 유사도 기법을 활용한 이슈 키워드 추출 방법 - 인터넷 뉴스 기사를 대상으로 -
  • Issue Keyword Extraction Method Using Document Similarity Method - Focused on Internet Articles -
저자명
이한동,김종배
간행물명
예술인문사회융합멀티미디어논문지
권/호정보
2017년|7권 8호(통권34호)|pp.383-391 (9 pages)
발행정보
인문사회과학기술융합학회|한국
파일정보
정기간행물|KOR|
PDF텍스트(0.31MB)
주제분야
사회과학
서지반출

국문초록

2016년 국내의 뉴스 이용에 관한 조사에 따르면 인터넷 뉴스 이용자는 약 70%이고, 이 중에서 76%는 포털 사이트에서 뉴스를 이용하는 것으로 나타났다. 또한 모바일 인터넷을 통한 뉴스 이용률 은 70.6%를 기록했다. 이렇게 뉴스를 접할 방법은 다양해졌으나 인터넷 상에서 뉴스를 선택하기 위한 정보는 헤드라인, 언론사와 본문 첫 1~2 문장이 전부다. 이를 위해 본 논문에서는 최근 검색 포털에 서 검색 순위에 나타나는 검색어의 형태로 제공하는 것이 사용자들의 편의성을 반영하는 것으로 판 단하여 사용자에게 제공할 또 다른 정보로 해당 기사와 기사가 다루고 있는 이슈의 키워드를 선정했 다. 또한 기사의 키워드와 이슈 키워드를 추출하기 위해서는 TF-IDF와 코사인 유사도를 활용하여 추 출한다. 포털 사이트에서 사회, 정치, 경제면의 조회수 1위 기사와 이와 유사한 복수의 기사들을 연구 의 대상으로 선정하였고 이를 대상으로 각 키워드를 추출한다. 향후 본 연구는 관련 이슈를 문장으로 요약하는 연구로 활용될 것으로 기대한다.

영문초록

According to research on Koean news usage in 2016, Internet news users account for about 70 percent and 76 percent people of them read news articles on portal sites. Also, the news service rate via mobile Internet recorded 70.6 percent. Even though there are various ways to view the news, users are provided the information which is only headline, press and first one or two sentences of an article. For this, this paper choose keywords to provide to users. Because it is judged that it is convenient for users to provide search terms in the search ranking in the recent search portal. And this paper extracts the issue-keywords and keywords of articles using by cosine similarity and TF-IDF methods of Text-mining. The subjects of this study are articles ranked first in each categories(political, social and economic pages) from portal site. and related articles with high cosine similarity to them. And this research is able to be used as a study to extract sentences the relevant issues.

목차

1. 서론
2. 관련 연구
3. 문서 유사도 측정 및 키워드 추출
4. 결론
References

구매하기 (3,000)