데이터 과잉의 시대의 핵심은 ‘검색’
빅데이터의 시대라 했다. 세상 모든 정보가 디지털화되어 쌓이고 있다. 데이터는 그 자체로는 의미가 없다. 이를 조합하고 검색할 때 비로소 정보가 되는 것이다. 그래서 빅데이터 다음에 온 키워드가 분석이며, 분석과 함께 필연적으로 언급되는 것이 검색이다.
우리가 사용하는 대부분의 웹 서비스는 검색에 기인한다고 해도 과장이 아니다. 구글이나 네이버의 서비스 근간은 검색이었으며, 이제는 지도 서비스, 문서 서비스 혹은 메신저와 같은 개별 앱(프로그램)에서도 검색창이 있다. 원하는 걸 바로 찾아야만 데이터는 정보로써 가치가 있는 법이다.
지금까지는 상용 검색 엔진을 구입하거나 자체 엔진을 개발해야 했지만, 지금은 ‘루씬’이 있다. 루씬은 자바 기반의 오픈소스 검색 라이브러리로 상용 검색 엔진에 버금가는 안정성과 고급 검색 기술을 갖췄다. 웹서비스에서 여전히 각광받는 자바 라이브러리라 활용도가 높고, 커스터마이징도 가능하다.
자바 기반 오픈소스 검색 엔진 루씬에 입문하기 위한 안내
『실전비급 아파치 루씬 7』은 그간 검색 엔진에 관심 있어 루씬을 알아봤으나, 어떻게 시작할지 막막한 이들, 나아가 엘라스틱서치와 솔라의 핵심인 루씬을 더 깊이 이해하고자 하는 개발자를 위한 안내서다.
이 책은 검색의 기초부터 고급 검색까지 한 권으로 다뤄 입문자들이 쉽게 접근할 수 있게 도왔으며, 루씬의 주요 개념과 동작 원리 등의 정확한 개념 설명과 풍부한 코드를 제시해 기존 개발자들의 갈증을 해소하려 했다.
충분한 주석과 상세한 설명이 곁들여진 코드는 깃허브로 추가 제공하여 전체 코드를 바로바로 확인할 수 있게 구성했다. 또한 각 장의 파일럿 프로젝트는 기존 서비스에 추가할 수 있을 수준의 실무 예제로 구성하였다.
자, 이제 루씬의 검색 세계로 떠나보자.
누구를 위한 책인가?
- 검색 서비스 개발에 관심 있는 자바 개발자
- 루씬을 이용해 독자적인 검색엔진을 개발하려는 개발자
- 상용 검색엔진을 걷어내고 오픈소스 검색엔진을 도입하려는 개발자와 기획자
- 루씬의 고급 검색 기능과 활용이 궁금한 개발자
이 책의 특징
- 최신 루씬 7.3 버전 반영
- 검색엔진의 주요 개념부터 루씬의 주요 용어와 클래스, 동작 원리 등 기초를 탄탄히 다져갈 수 있는 단계별 설명과 풍부한 소스 코드
- 한국 걷기여행길 관관정보, 트위터 날씨 데이터, 전국 음식점 검색 등 실무에 응용 가능한 파일럿 프로젝트 수록
- 특정 시점의 뷰, 세그먼트 병합의 원리, 유사도 알고리즘, 한글 형태소 분석의 원리, 커스텀 형태소 분석기 개발 등 다양한 고급 검색 기술 소개
- 깃허브(Github)에서 모든 파일럿 프로젝트와 예제 소스 코드 제공