[딥서치 활용법] 딥서치는 어떻게 자산운용에 활용될까

최근 금융투자업계는 ‘인공지능 투자’, ‘인공지능 자산운용’, ‘인공지능 자산관리’ 등 인공지능(AI)을 활용한 투자상품 혹은 이와 연관된 각종 서비스를 제공하고 있습니다. AI는 더 이상 먼 미래가 아니라 필수품으로 점차 자리 잡고 있다고 할 수 있어요.

이렇다보니 AI를 ‘만능’으로 보는 시선도 적지 않아요. 물론 AI가 지속 발전해 인간과 같은 사고 능력을 지닐 수도 있어요. 그러나 현재는 인간이 직접하기 어려운 일이나 사실상 불가능한 일을 대신해주는 역할을 담당하고 있습니다.

한가지 예를 들어볼게요. 주식시장에 영향을 미치는 요인은 헤아릴 수 없을 정도로 다양합니다. 각종 경제지표와 실적, 정부 정책 등은 기본이고 각 나라 문화와 성향 그리고 전쟁 등 돌발 변수도 존재합니다. 이 모든 것들을 ‘데이터’라고 정의하면 우선 각 데이터들이 독립변수로서 주식시장에 영향을 미치는 수준을 측정해야 하죠. 또 두 개 이상 변수가 동시에 발생했을 때, 주식시장 변동성도 확인해야 합니다.

만약 변수가 지속적으로 증가한다면 어떤 일이 벌어질까요? 인간이 가진 능력으로는 계산이 절대 불가하겠죠. 특히 정형데이터가 아닌 비정형데이터까지 포함한다면 분석은 차치하더라도 데이터 자체를 정리하는 작업만으로도 끝이 없을 거에요.

그러나 AI가 이러한 과정을 대신하면서 줄어든 노동 시간을 최종 산출물(ex: 투자상품)에 집중할 수 있어요. 기업가치 산정, 투자상품 개발 등 과정에서 필요한 노동을 줄이고 시간을 단축할 수 있게 되는 거죠.


딥서치는 어떻게 자산운용에 활용되는가

통상 자산운용은 크게 AI가 직접 운용하는 방식과 운용을 위해 방대한 데이터를 찾고 정리하는 방식으로 나눌 수 있는데요. 딥서치 AI(코어 엔진)는 후자에 해당돼요. 자금을 운용하는 펀드매니저는 투자 대상을 찾기 위해 뉴스, 증권사리포트, 공시, IR, 특허 등 다양한 문서를 접하게 됩니다. 하지만 하루에도 수없이 쏟아지는 문서를 일일이 다 확인한다는 것은 불가능하죠. 소송 등 중요한 이슈를 놓칠 수도 있고요.

또 ‘메타버스’와 같이 생소한 산업에 투자할 때, 어떤 기업이 해당되는지 확인해야 합니다. 뿐만 아니라 어떤 산업이 연계돼 있는지 알아야 투자전략을 수립하는데 용이하겠죠. 또 전쟁, 전염병 등 증시에 큰 영향을 미치는 다양한 이벤트 발생에 따른 분석도 필요해요.

앞서 나열한 사안들만 해도 만만치 않은 노동과 시간이 소요됩니다. 만약 이 작업을 AI가 대신해준다면 단순 노동과 시간을 줄이는 것 뿐만 아니라 더 다양한 분석을 수행할 수 있게 돼요. 한마디로 딥서치는 시장, 재무, 문서 등 다양한 정형, 비정형 데이터를 사용자가 원하는 형태로 정확하고 빠르게 확인할 수 있도록 돕고 있어요.


딥서치는 어떻게 트렌드를 파악하나

사용자가 원하는 결과를 제공하기 위해서는 방대한 데이터 확보가 필수에요. 딥서치는 현재 국내 130여개 언론사, 해외 200여개 언론사 전체 뉴스를 수집하고 있어요. 일일 뉴스량은 10만개로 1990년대 이후 발행된 뉴스 대부분을 수집해 총 10억개가 넘어요.

이렇게 수집한 뉴스를 기반으로 관심있는 주제를 발견하기 위해 머신러닝(ML) 기반 클러스터링(유사성 데이터 분류) 기술을 활용하고 있습니다. 클러스터링 기술은 크게 특징 추출, 문서군집, 스코어링 과정에 사용돼요. 수많은 뉴스가 이 과정을 거쳐 주요 이슈, 대표 키워드 등으로 분류됩니다.

분류된 이슈와 키워드는 최근 1달, 1년, 10년 등으로 확장돼 새로운 트렌드 출현과 소멸로 파악할 수 있게 돼요. 이중 대표 트렌드를 ‘딥서치 마켓 리서치’ 팀에서 선정하고 이를 기반으로 지수화하는 작업을 진행합니다.


딥서치는 어떻게 데이터를 정리하고 보여주나

딥서치는 자체 개발한 문서 검색 엔진을 보유하고 있습니다. 이 엔진이 특정 키워드에 대한 다수 문서를 기간별로 추출할 수 있도록 하는 핵심이에요. 추출된 문서 본문을 기반으로 확장 키워드를 다시 추출하게 됩니다. 이는 주제 키워드를 확장하는 과정으로 문서 내에서 핵심 키워드와 같이 언급되거나 파생된 단어들을 도출하는 것인데요. 예를 들면 ‘인공지능’과 연관된 ‘머신러닝’, ‘ML’, ‘AI’, ‘로봇’, ‘딥러닝’ 등이 확장 키워드가 되는 거에요.

핵심 키워드와 확장 키워드가 도출되면 이를 중심으로 관련된 문서를 5개년치 이상 검색합니다. 검색 대상 문서는 사업보고서 및 공시자료, 특허, 증권사 보고서, IR, 뉴스 등이에요. 특정 주제가 각 문서 내에서 언급되는 것은 해당 기업과 특정 키워드 연관성이 높다는 뜻으로 해석할 수 있어요.

특히 각 문서들은 기업, 애널리스트, 기자 등으로 작성 주체가 다르다는 특징을 갖고 있는데요. 그만큼 각기 다른 문서에 특정 주제가 동시에 포함될수록 해당 주제와 기업 연관도가 높다고 할 수 있겠죠. 한편으로는 특허 문서에 특정 주제가 자주 언급된다면 해당 기업은 관련 특허를 다수 보유하고 있다는 결론에 이르게 돼요. 따라서 각 문서별 특징을 반영해 가중치를 부여해 원하는 기업을 선별하기도 합니다.

한편, 앞서 언급한 과정을 통해 키워드 기반 기업 추출, 산업 추출, 극성 분석, ESG 분석 등이 가능해집니다. 정확히는 여러분들이 딥서치 플랫폼에서 ‘자연어’(인간이 사용하는 언어)로 검색했을 때, 원하는 결과를 보여주는 기반이 되는 거에요.


딥서치가 리서치와 자산운용에 강력한 이유

한국어 데이터 분류 과정에서 사용된 CNN

자연어로 데이터를 처리한다는 것은 상당히 큰 의미를 지녀요. 조금 과장된 표현으로 말하면 원하는 데이터 확인과 확보에 ‘한계’가 없다고 할 수 있어요. 통상 각종 데이터가 제공되는 형태는 서비스 이용자가 제공하는 범위 내에서만 이뤄지게 됩니다. 예를 들면 한국은행 경제통계시스템이 제공하는 데이터는 다양하지만 이용자는 한국은행이 제공하는 형식 내에서만 데이터를 확인 가능한 ‘제약’이 있죠.

딥서치는 자연어를 기반으로 하기 때문에 활용도는 이용자가 중심이 됩니다. 즉 이용자가 단순 데이터만 검색할 것인지, 복합 데이터를 검색할 것인지 아니면 연산 작업으로 검색할 것인지 여부에 따라 결과값이 완전히 달라지는 특징을 갖고 있어요.

위 데이터는 단순 ‘시가총액’으로 검색한 결과와 최근 3년 매출액 증가 기업 중 시가총액 높은 기업 순으로 도출한 결과에요. 이뿐만 아니라 비정형데이터와 정형데이터를 동시에 충족하는 “‘반도체’ 사업 기업 중 부채비율이 100% 이하인 기업”을 아래와 같이 보여주기도 합니다.

최근 3년 매출과 현금흐름과 매출, 영업이익, 당기순이익 등이 동반 상승한 기업도 도출이 가능해요. 여기에 배당이 확대된 기업을 추가하면 지속 성장하고 주주환원 정책을 꾸준히 이어가는 기업이 되겠죠. 수많은 데이터를 조건부 형태로 추가하기 때문에 도출할 수 있는 데이터는 사실상 무궁무진하다고 보면 됩니다.

이밖에도 다양한 재무데이터를 연산해 추가 작업 없이 빠르게 일을 처리할 수 있다는 장점도 있어요. 수많은 데이터간 상관관계를 그 어떤 주체보다 빠르게 확인할 수 있는 기반을 갖고 있다는 것이에요. 원하는 데이터를 바로 확인하고 확보가 가능하다는 점이 자산운용 준비과정에서 필요한 리서치 시간을 획기적으로 줄일 수 있는 요인이에요.


오늘의 딥서치 인사이트는 어떠셨나요? 아래 링크를 클릭하여 매일 이메일로 정보를 받아보세요.
[구독 신청 하기(무료)]

오늘의 이슈를 보다 깊이 있게 분석해 보기 원하시나요? 딥서치 서비스에 가입하고, 보다 깊이 있는 분석을 진행해 보세요.
[서비스 가입하기(무료)]

%d bloggers like this: