웹로그(Web Log) 분석
Web Log File이란 방문자가 웹서버에 접속을 할 때 생성되는 파일로서 크게 Access log, Error log, Referer log, Agent log의 네가지로 분류할 수 있다.
1. 웹로그의 유형
1) Access log
가장 널리 적용되며 누가, 왜 당신의 웹사이트를 방문했는지 등의 자료를 제공한다.
2) Error log
:웹 페이지에 접속 시 에러가 발생하는 경우에 기록됨. 예를 들어 파일이 발견되지 않는 경우는 404 File Not Found라는 문장이 나오고, 내부 서버의 에러가 발생한 경우는 500 Internal Server Error라는 메시지가 나오는 경우가 있음.
3) Referer log
당신의 웹사이트에 링크를 하고 있는 홈페이지의 주소를 파악하거나 서치엔진으로부터 어떠한 키워드를 통해 방문자가 방문을 하게 되었는지 등의 단서를 제공해 준다. 레퍼럴로그는 어떻게 방문자가 당신의 홈페이지를 찾는가를 알 수 있게 해주며 마케팅에서의 활용가능성이 높다.
4) Agent log
웹브라우저의 이름, 버전, OS, 화면해상도 등의 정보를 제공해 준다. 예를들어 Netscape Navigator를 기준으로 웹페이지를 작성하였는데 에이전트 로그를 살펴보니 MS-Explorer의 사용자가 훨씬 많았다고 한다면 마케터는 웹디자이너에게 익스플로러 환경에 최적화되도록 웹페이지를 제작할 것을 지시하여야 한다. 이처럼 에이전트로그는 마케터들과 개발자, 디자이너들에게 고객의 사용환경을 이해시키고 보다 나은 인터페이스를 구현할 수 있도록 도와 줄 수 있다.
※ Referer log나 Agent log의 경우 로그저장 공간 문제나 CPU의 처리문제 등으로 인해 반드시 제공되는 것이 아니라 옵션 형태로 제공해 주는 경우가 많다.
※ 엑세스 로그 구성요소의 예
203.236.132.1 - - [10/30/1999:05:00:00 -0500]
"GET /Images/myphoto.gif HTTP/1.0" 200 36055 |
호스트부분은 서로 다른 IP어드레스로부터 얼마나 많은 방문자가 방문하였는지에 대한 단서를 제공해 준다. 이것은 IP어드레스로 표현할 수도 있으며 DNS로 표현할 수도 있다. 그러나 www.helloec.net 등과 같이 도메인 네임으로 표현하는 경우에는 bandwidth를 많이 잡게 되는 경우가 있다. 한편, 이러한 호스트의 정확한 측정을 어렵게 하는 요소들도 많다. 가령 ISP에서 변동 IP를 사용하여 접속을 하거나, PC방이나 학교 등에서 동일한 컴퓨터를 여러 사람이 사용하는 경우, 기업에서 프록시(Proxy) 서버를 설정해 둔 경우에는 그 정확성에 문제가 제기될 수 있다.
② Identification ................. 예) -
사용자의 이름(User Name)을 표시하는 곳인데 거의 사용되지 않는 편이며 Hyphen(-)으로 보여지는 경우가 많다.
③ User Authentification ................. 예) -
패스워드 보호의 영역이다. 사용자 인증을 요구한 경우에 사용되며 보통 때는 Hyphen(-)으로 보여진다.
④ Time Stamp ................. 예) [10/30/1999:05:00:00 -0500]
타임 스탬프는 방문자가 어느 시간에 해당 파일을 호출했는지에 대해서 정확한 시간(연도, 날짜, 시간 등)을 알려준다. 마지막의 -0500은 표준시를 기준으로 한 시간대를 알려준다.
⑤ HTTP Request Field ................. 예) "GET /Images/myphoto.gif HTTP/1.0"
이 필드에서는 정보의 요청방식(Get, Post)과 요청한 파일의 이름(상대경로), HTTP의 버전을 알 수 있다. 보통의 경우 GET방식의 HTTP 1.0이 적용된다.
⑥ Status Code ................. 예) 200
상태 코드는 문서가 정상적으로 호출이 되었는지 등에 대한 상황을 알려준다. 정상적인 파일 전송의 경우에는 200이라고 표현된다.
상태코드 | 코드의 의미 | 적용 예 |
1** | Continue/ Protocol Change |
|
2** | Success | 200 - 정상적 파일 전송(Successful Transfer) 204 - 파일은 발견되나 내용이 없음 |
3** | Redirection | 웹사이트가 이동되거나 자동 슬라이드 효과 시 |
4** | Client Error/Failure | 404 - 파일이 발견되지 않음(File Not Found) |
5** | Server Error | 500 - 내부적 서버에러(Internal Server Error) |
⑦ Transfer Volume ................. 예) 36055
호출한 파일의 용량(Byte)을 의미한다. 데이터가 없는 경우 Hyphen(-) 혹은 0으로 표시된다.
<연습문제>
문제 1) 웹로그 파일의 유형 중 다음과 관련이 있는 것은?
『 어떻게 방문자가 당신의 홈페이지를 찾는가를 알 수 있게 해주며 마케팅에서의 활용가능성이 높다. 방문자가 어떤 URL로부터 홈페이지를 방문 하였는지, 어떤 서치엔진으로 부터 어떠한 키워드를 통해 당신의 홈페이지를 발견하고 방문하게 되었는지를 알게됨으로써 기업은 다른 웹사이트의 링크를 활성화 시키거나 자사의 홈페이지의 키워드 배치(Keyword Replacement)를 조정하여 방문효과를 제고할 수 있게 된다. 』 (EBS 모의문제)
① Referer log ② Agent log ③ Status log
④ Access log ⑤ Keyword Log
문제 2) 다음 지문이 설명하고 있는 웹 로그 파일은 무엇인가? (EBS 모의문제)
접속하는 방문자의 웹브라우저의 타입, 운영체제, 화면 해상도 등에 대한 단서를 제공해 준다. 예를 들어 넷스케이프 네비게이터 브라우저를 기준으로 웹페이지를 작성하였는데 이 로그를 분석하고 보니 익스플로러의 사용자가 훨씬 많았다고 한다면 마케터는 웹디자이너에게 익스플로러 환경에 최적화되도록 지시해야 한다.
① Agent Log ② Reference Log ③ Error Log
④ Access Log ⑤ Session Log
문제 3) Transfer Log File에 대한 설명 중 틀린 것은? (EBS 모의문제)
① 특정 웹 페이지에 대한 정보 요구 기록
② 고객의 방문 일자, 시간, 도메인 명 또는 IP 주소 등을 저장
③ 정보 요청에 대한 대응상태 또는 오류 코드를 저장
④ 접근로그라고도 한다.
⑤ 현재 요청하고 있는 파일이 요청된 위치의 URL을 기록
문제 4) 방문자가 언제 들어와서 얼마동안 머물렀고 어떤 페이지를 읽거나 어떤 페이지를 건너뛰었으며 어느 시간대나 요일에 가장 많이 접속하는지 등을 방문자의 기록을 토대로 소포트웨어 등을 활용하여 분석, 활용, 관리할 수 있게 해주는 방법을 무엇이라 하는가? (Ecampus 모의고사)
① 컨조인트 분석 ② 웹로그 분석 ③ BEP분석
④ SP분석 ⑤ 로그인 분석
문제 5) 인터넷 이용자가 웹사이트를 방문할 때 클라이언트의 하드 드라이브에 있는 텍스트 파일에 기록되는 텍스트로서, 특히 일대일(One-to-One) 마케팅을 원활히 수행하기 위한 분석에 필요한 것은? (제1회시험 1과목 기출문제)
① 쿠키(Cookies) ② 캐시(Cache
③ 웹 로그(Web Log) ④ 캔디(Candy)
⑤ 로봇(Robots)
문제 6) 웹사이트를 방문한 고객들의 특성을 분석하기 위한 기초 자료가 아닌 것은? (제1회시험 1과목 기출문제)
① Access Log ② Referrer Log
③ 쿠키 정보 ④ Error Log
⑤ 등록 정보
문제 7) 웹 로그 파일(Web Log File)로부터 얻어낼 수 있는 정보와 거리가 먼 것은? (제1회시험 1과목 기출문제)
① 웹사이트 방문 횟수(Number of Visits) ② 사용된 브라우저(Browser Used)
③ 사용자의 도메인과 호스트(Domain and Host of the User)
④ 사용자의 나이(User Age) ⑤ 문의한(Referring) URL
문제 8) 다음 중에서 Access Log 파일에서 제공하는 데이터가 아닌 것은? (제1회시험 2과목 기출문제)
① 방문자의 IP 또는 도메인 네임 ② 방문자가 파일을 요청한 시간
③ 방문자가 웹 서버에 요청한 처리 내용 ④ 방문자가 요구한 파일의 이름
⑤ 방문자가 사용하는 회선의 속도
문제 9) 다음 ( )에 들어갈 가장 알맞은 단어는 무엇인가? (EBS 모의문제)
인터넷마케팅 관리자는 자사의 홈페이지 방문자가 언제, 어디에서, 어떠한 홈페이지를 방문하여 살펴보았는지, 어떤 홈페이지에 얼마 동안 머물렀는지 등의 다양한 데이터들을 ( )을 통해서 분석할 수 있으며, 이를 토대로 보다 효율적인 마케팅 전략을 재수립할 수 있다.
<정답>
문제1) ① Referer log
문제2) ① Agent Log
대표적인 로그파일에는
① Access Log(방문자의 IP 주소 또는 도메인 네임, 방문시간 등),
② Reference Log(어떤 검색엔진으로부터 방문했는지, 어떤 URL로부터 방문했는지 등),
③ Agent Log(웹 브라우저의 타입, OS, 화면 해상도 등)
④ Error Log(요청한 홈페이지가 없거나 링크가 잘못되는 등의 오류가 있을 경우 생성) 등이 있다.
문제3) ⑤ 현재 요청하고 있는 파일이 요청된 위치의 URL을 기록하는 것은 Referer Log file이다.
문제4) ② 웹로그 분석
문제5) ① 쿠키(Cookies)
웹로그와 비슷하나 성격이 약간 다른 쿠키에 관한 설명이다. 쿠키(Cookies)는 인터넷 이용자가 웹사이트를 방문할 때 서버가 아닌 클라이언트의 하드드라이브에 있는 텍스트파일에 기록되는 파일로서 일대일 마케팅을 위한 사용자 분석에 필요하다. 한편 웹로그는 클라이언트가 아닌 웹서버에 기록되는 분석정보이다.
문제6) ④ Error Log
1) 웹사이트를 방문한 고객들의 특성을 분석하기 위한 기초자료로 웹 로그파일이 이용되는데 웹 로그파일은 크게 Access log, Referer Log, Agent log, Error Log로 구성되어있다.
2) 지문 중 에러 로그는 요청한 홈페이지가 없거나 링크가 잘못되는 등의 오류가 있을 경우에 생성되는 파일로 방문고객의 서핑특성을 분석하는데 관계가 없다.
문제7) ④ 사용자의 나이(User Age)
웹로그 파일의 분석을 통해서 다음과 같은 사실 등을 파악할 수 있다.
- 방문자의 방문경로
- 방문자의 접속 도메인. 시간대. 요일 등의 추이파악
- 서치엔진으로부터의 방문자의 수 및 주요 키워드
- 컨텐츠별 방문 빈도 및 방문시간, 체류시간
- 동일호스트로부터의 단골고객
- 방문자가 사용한 브라우저
웹 로그 파일의 분석을 통해서도 방문자의 나이는 알 수 없다.
문제 8) ⑤ 방문자가 사용하는 회선의 속도
문제 9) 웹 로그 파일(Web Log File)