징한 레퍼러 스팸

오늘 서버가 좀 이상한 김에 아파치의 access 로그를 tail 로 살펴보니 아직도 soojung 블로그로 엄청나게 들어오더군요.
코멘트도 못 달게 빼버렸는데 뭘 그리 들어오는지 아주 징합니다.
그래서 얼마나 들어오나 하고 grep -i soojung access.log 로 잡아보니 10만 pv 정도는 가뿐히 넘어주네요.
안 되겠다 싶어서 어디서 들어오나 하고 ip 만 잡아냈습니다.
grep -i soojung access.log | awk '{print $1}' > soojung.txt
결과를 보니 40만이 넘는 라인이 나오고 ip도 너무 다양합니다. 이래서는 아파치 설정으로 블럭킹 하기도 힘들겠네요.
그래서 다시 한 번 결과를 필터링 해야겠다 싶습니다.
sort soojung.txt | uniq -c | sort -nr > soojung_uniq.txt
이제 가장 많이 들어온 아이피 순으로 정렬 된 유일한 아이피 목록을 얻었습니다.
그래도 일만 라인 정도가 나옵니다만 상위 10개 정도만 막으면 될 것 같습니다.

10개는 좀 적은것 같아서 20개를 막았습니다.
에러 로그를 보니 잘 막는군요. 이제 좀 포기할까요?
다음 달에 다시 한 번 통계를 만들어서 막아야겠습니다.