기관회원 [로그인]
소속기관에서 받은 아이디, 비밀번호를 입력해 주세요.
개인회원 [로그인]

비회원 구매시 입력하신 핸드폰번호를 입력해 주세요.
본인 인증 후 구매내역을 확인하실 수 있습니다.

회원가입
서지반출
국내 웹 그래프의 링크 구조 분석
[STEP1]서지반출 형식 선택
파일형식
@
서지도구
SNS
기타
[STEP2]서지반출 정보 선택
  • 제목
  • URL
돌아가기
확인
취소
  • 국내 웹 그래프의 링크 구조 분석
저자명
서정주,김진일,김은상,김영호,정하웅,김성렬,박근수,Seo. Jungjoo,Kim. Jinil,Kim. Eunsang,Kim. Daniel,Jeong. Hawoong,Kim. Sung-Ryul,Park. Kunsoo
간행물명
정보과학회논문지. Journal of KIISE. 컴퓨팅의 실제 및 레터
권/호정보
2013년|19권 1호|pp.7-14 (8 pages)
발행정보
한국정보과학회
파일정보
정기간행물|
PDF텍스트
주제분야
기타
이 논문은 한국과학기술정보연구원과 논문 연계를 통해 무료로 제공되는 원문입니다.
서지반출

기타언어초록

웹을 구성하는 웹 페이지들과 페이지들 사이의 하이퍼링크들은 방향성을 지니는 그래프로 표현될 수 있으며, 웹 그래프가 가지는 독자적인 링크 구조의 특성은 다양한 분야의 연구에서 활용되고 있다. 현재 검색 엔진들이 수집한 웹 페이지들은 그 규모가 수십억 개로 방대한 양을 이루고 있다. 본 논문에서는 약 3억 개의 국내 웹 페이지들을 수집하고, 이들 간의 약 137억 개의 하이퍼링크들을 추출하여 생성한 웹 그래프의 구조에 대해 분석한다. 또한 그래프 알고리즘을 이용하여 웹 그래프를 구성하는 요소들로 나눈 후 전체적인 구조를 도식화한 보우타이 다이어그램을 도출한다. 국내 웹 페이지들은 링크의 진입 차수와 연결 요소들의 크기 분포에서 멱법칙을 따르며, 웹 페이지의 진출 차수는 특정 차수 이상에서 멱법칙을 따른다. 또한 웹 그래프는 평균 연결 거리가 매우 짧은 약 12 정도로 small-world network의 성질을 가지고 약 40%의 웹 페이지 쌍 사이에 경로가 존재하며, 국내 웹 그래프는 해외의 경우보다 연결도가 더 높다.

기타언어초록

The World Wide Web consisting of web pages and hyperlinks amongst them can be represented as a directed graph. The structural and evolutional properties of the Web graph are useful in a variety of research area such as sociology and computer science. In this paper, we crawled 0.3 billion Web pages and 13.7 billion hyperlinks amongst them from Korean Web and built the Web graph by extracting the link structure. We show the bow-tie diagram which visualizes the overall structure of the Web graph. In-degrees and sizes of connected components of web pages of Korean web follow power law distributions whereas out-degrees shows power law distribution when the degree is higher than a particular value. Also, 40% of pairs of the Korean web graph have a path between them with average distance around 12 demonstrating that the Korean web graph shows a small-world phenomenon. The Korean web graph shows a higher degree of connectivity compared to the global web graph.