본문으로 바로가기

세상에서 제일 멍창한 네어버 검색 알고리즘 고발

category Blog 2014. 11. 26. 07:52

네이버 검색 누락을 당한 일

네이버 검색 누락을 당했어요. 어떤 느낌이 드나면요, 사소한 실수 하나로 여자친구가 갑자기 이별 통보를 보내온 느낌이네요. 네이버 정말 예민합니다. 얼마전 글쓴이가 한달 동안 새로 키워왔던 블로그 하나가 블로그 차트 사이트에서 블로그 랭킹 136,845위를 차지했어요. 글쓴이가 가진 블로그 중에서는 제일 높은 순위였죠. 


새로 블로그를 키운지 한달만에 네이버가 찾아왔고 게시물이 15개 정도 되었는데 몇몇 게시물들이 검색 최상위에 올라와 게시물 대비 방문자 수가 높았습니다. 그동안 정말 네이버 검색 유입을 즐겼어요. 쓰는 글마다 검색 최상위로 등장하며 매우 기분이 들떠 있었죠. 



블로그 주소 변경이 가져온 검색 누락 

글쓴이가 블로그가 더 커지게 전에 하고 싶었던 게 있었어요. 문자 주소를 숫자 주소로 바꾸는 거였죠. 이 문자 주소는 다른 곳으로 복사해 놓으면 한글이 보이지 않고 %%%%%식의 특수 문자만 보이기 때문에 빨리 변경해야할 부분이었어요. 혹시 네이버 검색에서 문제가 되는지 확인했지만 네이버에서는 숫자 주소를 반영하고 있었습니다. 그래서 문자 주소를 숫자 주소로 변경해도 상관없겠다고 결론지었어요. 





숫자 주소로 바뀐 뒤에도 변경 후 이상 없이 네이버 검색 유입이 잘 되었어요. 하지만 개별글 주소를 바꾸고 난 뒤 하루 정도 흐른 뒤에 검색 누락을 시켜버리더군요. 이제 네이버 세상에서는 보이지 않는 유령 블로그가 된 것입니다. 아름다웠던 1주일이 지나가버렸죠. 


이 글을 검색 누락 당한 블로그에 쓰고 싶지만 네이버 검색이 안되니 네이버 검색이 되는 블로그에서 글을 쓸 수밖에 없네요. 언젠가는 네이버 프로젝트라는 이름으로 네이버에게 강력하게 대응하는 그런 사이트를 하나 만들 고 싶습니다. 그동안 말은 안해서 그렇지 네이버에 대한 불만이 정말 많았습니다. 글쓴이는 세상에서 제일 멍청한 검색 알고리즘이 네이버라고 생각합니다. 


좋지 못한 글쓰기로 운영한 사이트

글쓴이는 야구 글만 기재하는 사이트를 가지고 있어요. 처음에는 멋모르고 시작할 때라 검색 엔진이 좋아하는 글이 무엇인지 잘 알지 못했어요. 그래서 좋은 글을 쓰지 못했어요. 인터뷰는 단순한 사실을 보도한 거라 저작권에 문제가 되지 않는다고 잘못 알고 있어 뉴스 기사에서 나온 류현진 인터뷰를 복사해 인용한 글이 존재했고 영문글과 함께 번역해 놓은 글도 있었습니다. 글쓴이의 독창적인 글도 많았지만 이런 종류의 글들이 사이트 전체에 좋지 않게 작용한게 아닌가 싶습니다.  


네이버에 찍히면 좋은 글을 써도 노출되지 않는다.

글쓴이는 시간이 흘러 인터넷 글쓰기의 노하우가 향상되었습니다. 또 많은 글을 쓰다보니 글쓰기 실력이 향상된것인지 예전 글보다 좋은 글이 늘어나게 되었습니다. 다른 검색사이트에서는 노력한만큼 대가를 인정받았지만, 유일하게 네이버에서는 찬밥 신세입니다. 네이버에게 한번 찍히면 그 순위를 만회하기가 힘든 것 같네요. 그래서 차라리 다시 키우는게 더 낫다고 하는 분들이 많은데요, 글쓴이도 다시 키우는 게 효율적인 방법이라고 생각합니다. 하지만 이미 클 때로 다 커버린 사이트라면 어쩔 수 없습니다. 즐겨찾기로 와주시는 분들이 꽤 계신데 어떻게 외면할 수 있습니까?


네이버에 검색 알고리즘 고발

이 글의 제목이 세상에서 가장 멍청한 네이버 검색 알고리즘 고발이라는 주제로 글을 쓰고 있는데요, 서론이 좀 길었습니다. 본격적으로 얼마나 멍청한 짓을 하고 있는지 여러분들께 알려드릴께요. 


가장 좋은 검색 엔진이란?

검색을 하면 검색 엔진이 수 많은 글들을 분석해서 사용자가 가장 만족할 수 있는 세상에서 가장 좋은 글이 최상단에 노출해야할 것입니다. 그런 검색 엔진이 가장 좋은 검색 엔진이겠지요. 그런 의미에서 가장 멍청한 네이버 검색 알고리즘을 소개합니다. 


잠실 야구장 vs 메이저리그 구장 크기 비교

글쓴이는 잠실 야구장이 얼마나 큰지 알고 싶었어요. 메이저리그에서 잠실 구장의 크기가 어느 정도가 되는지 궁금하였습니다. 그래서 잠실구장과 메이저리그 각 구장들의 위성사진을 토대로 실제 길이와 축적을 계산해서 비교한 글을 쓰게 되었어요. 사람들의 호응은 정말 좋았습니다. 


잠실 야구장 얼마나 크길래? 메이저리그 구장과 크기 비교 

http://baseballgen.com/425



네이버의 이중성

이 글은 다음 해외스포츠 투데이 네티즌에 올랐고 정확히 기억은 안나지만 네이버 메인에서도 소개가 되었던 글입니다. 글쓴이는 네이버 오픈 캐스트에 글을 수시로 올리는데요, 네이버 메인에 자주 소개됩니다. 많이서 일일이 캡처를 해서 보관하고 있지 않은데요, 앞으로도 얼마든지 소개될 수 있기 때문입니다. 네이버 메인에 글쓴이 글이 소개된다는 이야기는 네이버 에디터가 글쓴이의 글의 내용을 인정한다는 뜻이겠죠. 



김광현 포스팅과 가장 불운한 투수 이야기라는 제목으로 

글쓴이의 글이 메인에 네이버 메인에 올라와 있다. 


네이버 오픈캐스터 주소: http://opencast.naver.com/BB011


검색 결과로 알아보는 네이버 검색 알고리즘

네이버 검색 알고리즘이 얼마나 좋은 글을 반영하고 있지 못한지 본격적으로 살펴보도록 하겠습니다. 사용자는 잠실 야구장과 메이저리그 구장의 크기를 비교해보고 싶어요. 되도록 정확한 정보를 위해 구체적으로 검색어를 넣어 검색을 할겁니다. 


만약 글쓴이가 사용자라면 검색어를 다음과 같이 넣어서 검색할겁니다. 


잠실 야구장 메이저리그 구장 크기 비교


네이버를 가장 나중에 살펴보고 다음, 네이트, 구글, 줌, 빙, 야후 순으로 결과를 살펴보겠습니다. 



다음 검색 결과



다음에서 검색 결과 1위를 차지

다음은 글쓴이의 글을 가장 좋은 글이라고 인정하였습니다. 다음에게는 너무 고마운 일입니다. 티스토리 블로그 사용자들은 너무 공평한 다음에게 서운함도 있나봐요. 왜냐하면 네이버는 늘 자사 블로그를 우선 순위에 두니까요. 다음이 글쓴이의 글을 1위로 인정하였습니다. 



네이트 검색 결과



네이트에서 검색 결과 1위를 차지

네이트는 다음 검색 결과를 그대로 이용하므로 큰 의미는 없습니다. 네이트가 다음 검색 엔진을 가장 신뢰하였기 때문에 다음 검색 엔진을 탑재했고 그 결과 네이트는 글쓴이의 글을 1위로 인정하였습니다. 




줌 검색 결과



줌에서 검색 결과가 제대로 반영 안됨, 글쓴이의 다른 글이 1, 3, 4위 차지

줌 검색 결과는 왜 저런 결과가 나왔는지 이해할 수 없네요. 글쓴이 글이 1, 3, 4위를 차지했지만 '잠실 야구장 얼마나 크길래? 메이저리그 구장과 크기 비교' 라는 글은 빠져있습니다. 그 이유를 잘 모르겠네요. 줌에서는 어디에서도 찾아볼 수가 없네요. 글쓴이가 쓴 1, 3, 4위를 차지한 글은 잠실 야구장과 메이저리그 구장의 크기를 비교하는 글이 아닙니다. 줌은 번지수를 잘못 찾은 것 같아요.




구글 검색 결과


구글에서 검색 결과 1위를 차지

구글은 글쓴이의 글을 1위로 선정하였습니다. 4위에 글쓴이 글을 rss로 일부 노출시키는 사이트가 4위를 차지하고 있네요. 3위를 차지한 '[LG] 메이저리그 구장 크기....& 잠실 구장 : MLBPARK' 글은 글쓴이의 글은 아니지만 잠실과 메이저리그 구장의 크기를 비교하는 좋은 글입니다. 



빙 검색 결과


빙에서 검색 결과 1위를 차지

마이크로소프트 빙 검색엔진도 글쓴이의 글을 1위로 선정하였습니다. 3위를 차지한 '[LG] 메이저리그 구장 크기....& 잠실 구장 : MLBPARK' 글은 앞서 언급한 글이고 5위를 차지한 'KBO 와 MLB 구장들의 크기 비교' 글도 나름 정성스럽게 쓴 좋은 글입니다. 



야후 검색 결과


야후에서 검색 결과 1위를 차지

야후 검색엔진도 글쓴이의 글을 1위로 선정하였습니다. '[LG] 메이저리그 구장 크기....& 잠실 구장 : MLBPARK' 글과 'KBO 와 MLB 구장들의 크기 비교' 글이 4, 5위에 배치되어 있네요. 순위는 다르지만 상단에 올라와 있습니다. 


그럼 세상에서 제일 멍청한 네이버 검색 알고리즘은 어떨까요? 네이버로 인해 고통받고 계시는 분들이 많은데요, 네이버는 세상에서 가장 멍청한 검색 결과를 보여줄겁니다.





사용자의 검색 의도를 파악하지 못하는 멍청한 네이버 검색 알고리즘

네이버 검색 결과는 사용자의 의도를 파악하지 못하고 최상단에 '광주 신축야구장 펜스와 메이저리그 야구장 펜스 비교'라는 제목의 글을 보여주고 있습니다. 이 글은 매우 좋은 글입니다. 광주 신축 야구장과 메이저리그 야구장의 펜스를 정성스럽게 비교한 좋은 글입니다. 하지만 사용자는 잠실 야구장과 메이저리그 구장 크기를 비교하고 싶었습니다. 네이버는 검색 의도와 전혀 상관 없는 글을 최상단에 올리고 있네요. 검색 알고리즘이 좋지 못하다는 것을 알 수 있습니다. 


원본글 아니라 링크글이 최상단에 반영되는 멍청한 네이버 검색 알고리즘

가장 문제인 것은 웹문서 부분에 글쓴이의 원본 글을 올라와 있지도 않는데 퍼온 글이 웹문서 부분 최상단에 위치하고 있습니다. 퍼온 이는 글 제목에다 퍼온글이라고 분명이 명시하였지만 네이버는 퍼온 글이라는 문구을 삭제하여 보여주고 있습니다. 퍼온 이는 친절하게도 명시적으로 글쓴이의 주소를 링크시켰습니다. 링크를 시킨 링크 글이 웹문서 최상단에 올라와 있다니 이 얼마나 원작자를 회롱하는 행위입니까? 글쓴이 말고도 네이버에게 고통당하시는 분들이 많을 거라 봅니다. 




퍼온글 [펌글]을 훼손하고 네이버 검색 결과

MLBPARK에서 한 유저분이 글쓴이의 글을 퍼와서 한게(한국야구타운 게시판)에 게시하였습니다. MLB파크에서는 저작권에 대한 개념이 없는 동네입니다. 이 글의 조회수가 3635명이었지만 링크 경로를 따라 들어온 방문객수는 50명도 채 넘지 않았습니다. 네이버가 이 글을 웹문서 최상단으로 올려놓으므로 인해서 네이버를 통해 글쓴이에게 들어오는 유입수는 100% 중에서 1.3%밖에 되지 않는다는 이야기입니다. 사실상 문제가 많지요. 


위 퍼온 글에서는 [펌글]이라고 명시적으로 써놓았습니다. 그런데도 불구하고 네이버는 [펌글]이라는 중요한 사실을 제외시켜서 왜곡한채 보여주고 있습니다. 이 얼마나 파렴치한 행동입니까? 이는 원작자를 무시하는 행위이며 네이버는 저작권에 대해 깡그리 무시하는 태도를 보여주고 있습니다. 


네이버 모바일 검색 알고리즘은 PC검색과 다르게 신뢰도보다 정확도와 최신 문서를 많이 반영하는 편입니다. 네이버 모바일 검색 결과를 살펴보겠습니다. 



네이버 PC 검색과 비슷한 결과를 보여준 네이버 모바일 검색 결과 

네이버 모바일 검색 결과를 기대했지만 마찬가지 검색 결과를 가져다 주었네요. 여전히 검색 의도와 큰 상관 없는 글과 원본글은 반영하지 않으면서 복사글이 그 다음 순위를 차지하고 있네요. 네이버가 펌글이라는 꼬리를 떼면서까지 링크 글을 올려놓은 걸 보니 원작자인 글쓴이를 조롱하고 있는 것처럼 느껴지네요. 


'광주 신축야구장 펜스와 메이저리그 야구장 펜스 비교'글을 쓰신 분께 다시 한번 죄송하다는 말씀을 드리고 싶어요. 네이버의 검색 결과를 비판하는 것이지 좋은 글 쓰셨던 분의 글을 비판하는 것이 아닙니다. 인터넷 검색의 약 70~80%를 차지하는 네이버 검색에 대해 공익을 위해 잘못된 검색 알고리즘을 비판하는 것이니 양해 부탁드립니다. 


검색 결과 정리


글 제목

구분

네이버

다음

네이트

구글

야후

잠실 야구장 얼마나 크길래? 메이저리그 구장과 크기 비교

창작물

웹문서 8위

1위

1위

누락

1위

1위

1위

[LG] 메이저리그 구장 크기....& 잠실 구장

복사글

-

-

-

-

3위

3위

4위

KBO 와 MLB 구장들의크기 비교

복사글

-

4위

4위

2위

-

5위

5위

[펌글] 잠실 야구장 얼마나 큰가? 메이저리그 구장과 크기 비교

복사글

웹문서 1위

-

-

-

-

-

-


글쓴이가 좋은 내용이라고 평가했던 '[LG] 메이저리그 구장 크기....& 잠실 구장'과 'KBO 와 MLB 구장들의크기 비교'은 복사글에 지나지 않았습니다. 그래서 네이버는 검색 결과에 반영시키지 않았던 것으로 보이네요. 좋은 글인데 빠져 있길래 의아해했지만 이해가 되었습니다. 


7개 검색 엔진 중 1위에 5번 선정

글쓴이의 글은 7개의 검색 엔진에서 검색 결과 1위에 다섯번 선정되었습니다. 특히 외국 회사인 구글, 빙, 야후에서는 1위로 손꼽았습니다. 그들이 네이버 검색 알고리즘보다 형편없을까요? 그렇지 않습니다. 야후는 1세대 검색엔진입니다. 알타비스타 검색엔진을 탑재하기도 했는데요, 아직 살아남았습니다. 그들의 기술력을 무시할 수 없어요. 


검색분야 최고의 기술을 가진 기업은 구글입니다. 구글의 기술력은 부인할 수 없습니다. 심지어 구글은 인터넷의 창시자라고 할 수 있는 역사적인 인물인 빈튼 서프를 영입하였고 구글의 부사장으로 일하고 있습니다. 빈튼 서프는 TCP/IP 프로토콜을 탄생시킨 인물이지요. 구글은 그런 전설적인 인물을 기용하고 있습니다. 세계 각국의 인재들을 모아서 기술력 향상에 힘쓰고 있습니다. 


그들이 한글을 몰라서 글쓴이의 글을 1위에 올려 놓았을까요? 외국 기업과 다음, 네이트는 퍼온 글을 최상단에 올리는 그런 멍청한 짓은 하지 않았습니다. 네이버는 한글로 퍼온글이라고 기재해뒀지만 아무렇지 않게 최상단에 올려 놓습니다. 네이버는 자사의 검색 엔진 알고리즘이 얼마나 멍청한지 보여주고 있습니다. 


글쓴이의 글만 이렇게 차별당하는 것은 아니라고 봅니다. 글쓴이 말고도 차별받으시는 분들을 대변하는 입장에서 이 글을 쓰고 또 나아가서 대한민국의 공익을 위해서 국가적인 낭비를 막기 위해서 고발하고 제언하는 것입니다. 네이버는 자사에 이익이 되지 않는다고 글쓴이의 글을 모두 제외시킬수도 있습니다. 아시잖아요. 네이버가 갑으로서의 얼마나 많은 횡포를 일삼코 있는지 아시는 분은 아실거라 생각합니다. 글쓴이는 네이버의 검색 누락 두렵지 않습니다. 글쓴이는 잃을 것이 별로 없어요. 


자사의 이익에 눈이 멀어 공공재와 같은 인터넷 검색 시장에서 횡포를 일삼아 좋은 정보를 찾지 못하게 하는 것은 국가적으로 큰 손실로 이어질 것입니다. 네이버가 좋은 검색 엔진으로 사랑받는 그날까지 네이버의 횡포를 지속적으로 고발할 예정입니다. 





글쓴이의 블로그에 찾아온 트리님의 글이 자꾸 떠오르네요. 공정하지 않는 네이버는 오늘도 내일도 젊은이들의 일자리를 빼앗아 가고 있습니다.