이번에 5월 10일(금) ~ 5월 11일(토) 이틀간 부산 BPEX에서 개최된 한국정보시스템학회 춘계 학술 대회에 참여했다.
그래서 다녀온 소감에 대해서 간단하게 적는 회고록을 써보도록 하겠습니다.
아래는 해당 학회 홈페이지이다.
😁 참여 계기
참여하게된 계기는 저희 학교에 매학기 선발된 인원이 학점과 지원금을 받고 원하는 주제로 프로젝트를 수행하는 "알파 프로젝트"가 존재합니다. 저는 4학년 1학기에 "이음" 프로젝트로 선발되었습니다. "이음" 관해서는 제가 다른 글에 자세히 소개해놨으니 궁금하신분들은 아래 글 확인해주시면 감사하겠습니다.
어쨌든, 저희 프로젝트가 "학생들이 보다 같이 사이드 프로젝트를 진행할 인원을 쉽게 찾을 수 있도록 하여, 팀플 경험을 쌓도록 돕는 것을 목적으로한다."라는 목표로 진행하고 있었습니다. 그래서, 적절한 팀원을 쉽게 찾을 수 있도록 "AI 팀/팀원 추천" 기능도 존재합니다. 그러던중, AI를 담당하는 팀원이 이 기능을 논문으로 발표하면 더 좋지 않을까?라고 의견을 냈던 것에서 시작했습니다. 학회에 관련된 비용이 지원되기도 하고, 지도 교수님께서도 긍정적으로 봐주셔서 추진하게 되었습니다.
그 뒤로 저는 비록 백엔드 개발이다보니 AI에 관해서는 얄팍하게 알고 있었지만, 팀장으로서 학회 참여와 관련된 비용 서 처리, 해당 내용에 관련된 자료 조사, 논문 검토 등 제 1저자인 AI 팀원을 위해서 열심히 도와주었습니다.
📒 참여 주제
제 1저자인 AI 팀원이 쓴 "딥러닝 추천시스템: Wide & Deep 모델의 적용 (박준석 외, 2024)"논문 내용을 바탕으로 글을 작성했음을 밝힙니다.
초기의 추천 시스템은 콘텐츠 기반 필터링 모델과 협업 필터링 모델을 주로 사용했습니다. 하지만, 데이터의 양과 다양성이 증가하면서 정보가 부족한 아이템은 제대로 추천되지 않는 문제와 많은 데이터 처리가 계산 효율을 저하시키는 문제로 이러한 방법들만으로는 사용자의 요구와 취향을 만족시키기 어려워졌었습니다.
그래서, Amazon, 구글, Netflix 등등이 딥러닝 기술을 활용하여 사용자의 데이터와 패턴을 더 깊이 분석하는 방법으로 사용자 패턴에 더 알맞게 추천해준다고 합니다. 저희 "이음"도 Wide & Deep 기반의 딥러닝 추천 시스템을 직접 적용해보고, 사용자의 취향과 기술 스택에 적합한 프로젝트 추천하는 알고리즘을 시험해보았습니다.
실제로 구글에서 2016년에 발표한 “Wide & Deep Learning for Recommender Systems" 논문에 의하면, 구글은 이 추천 시스템을 구글 플레이스토어에 적용하여 매우 효율적이고 효과적인 성능을 이루어냈다고 서술되어 있습니다.
머신 러닝에서 Linear 모델은 단순하고, 해석이 용이하고, feature 간의 cross-product를 통해 데이터의 특징을 기억하는데 (Memorization) 효과적입니다. 하지만, 일반화(Generalization)를 위해서 따로 많은 과정을 거쳐야 합니다. Memorization을 통해 과거 Rating을 바탕으로 사용자에게 직접적으로 관련된 정보를 추천해줄 수 있습니다. 반대로, 등장하지 않았던 조합들에 대해서는 설명력이 떨어진다는 단점이 있습니다. Generalization은 그에 반대입니다. 등장하지 않았던 상품에 대해서도 내줄 수 있기 때문에 추천의 다양성을 증가시킵니다. 하지만, 문제는 실존할 수 없는 관계에 대해서도 과도하게 일반화 결과를 내놓을 수도 있습니다.
Wide 모델은 Memorization에 강하고, Generalization에 약합니다. 앞서 언급했다 싶이, cross-product를 통해 데이터의 특징을 더 잘 기억할 수 있습니다. 반면에 Deep 모델은 Generalization에 강합니다. 순방향 신경망을 사용하며 밀집된 임베딩을 통해 특징들을 처리하며 일반화에 더 중점을 둡니다. 그래서 구글은 이 두 모델을 조합해서 Wide & Deep 모델을 이용하여 대규모 추천 시스템에서 더 뛰어난 성능을 내는 것입니다.
저희 "이음"에서도 위 그림과 같이, 사용자가 Python의 기술 역량을 가지고 Deep learning를 필요로 하는 프로젝트를 선택한 경우, 이 상호작용은 (Python, Deep learning) = (1,1)로 표현되며, 총 9가지가 존재합니다. 이 방식은 1이되는 모든 경우를 학습하기 때문에 memorization에 강합니다. 하지만, (Python, Data Analysis)와 같이 0이 되는 조합에 대해서는 학습할 수 없다는 한계를 가지고 있습니다.
Deep 모델은 위 그림과 같이, 모든 프로젝트의 필요로 하는 역량들을 임베딩 공간 내에서 표현함으로써, 심지어 관계가 없는 기술 역량의 조합까지도 학습할 수 있도록 합니다. 이 접근 방식은 드물게 발생하는 조합에도 generalization을 강화하지만, 충분한 정보가 부족한 경우 적절한 임베딩 표현을 얻기 어려울 수 있습니다.
그래서, Wide & Deep 모델을 이용하여 두 부분을 동시에 최적함으로써, 데이터의 넓은 범위의 상호작용과 같이 있는 특성을 모두 포착할 수 있도록 설계한 것입니다.
데이터셋으로는 설문조사를 통해 얻어진 데이터와 더미 데이터를 바탕으로 구성했습니다. 하지만, 팀플 관련 추천 데이터가 워낙 없기 때문에 한계가 많이 존재하고 아직 부족한 부분이 많습니다.
🗨️ 학술대회 발표
5/10 (금) 학회 참여를 위해 팀장 및 백엔드 담당인 저와 논문 제 1저자이자 발표자인 AI 팀원, 이음 플랫폼의 프론트를 제작했던 프론트엔드 팀원 1명과 함께 부산으로 출발했습니다.
사실, 학술대회 참여는 발표자인 제 1저자만 참여해도 괜찮긴 했습니다. 하지만, AI에 관해서는 제가 너무 문외한이어서 더 넓은 시야를 가지고 싶었고, 학술대회 참여는 이번이 처음이라 어떤 곳인지 궁금해서 같이 부산으로 가게 되었습니다. (팀장이라 지출 관련 증빙 자료를 철저히 하기 위함도 있었음)
서울에서 부산까지 좀 긴 여정이었지만, 그래도 부산 바다도 보고, 학회장도 처음 들어가보고 매우 좋은 경험이었습니다.
저희 발표는 거의 초반이었어서 AI 팀원이 나가서 발표를 진행했습니다. 그런데, 저희 세션 발표들을 듣는데 학회를 잘못 선택했다는 느낌이 좀 들었습니다. 저희 세션에서 발표한 사람들이 KAIST 박사, 경희대학교 교수님, 이화여대 석사 등등 매우 다양했습니다. 다들 굉장히 전문적이고 오랫동안 연구하신 느낌이었습니다. 게다가 각 발표가 끝나고, 교수님들께서 발표에 대해서 질문을 하시는데 굉장히 날카로운 질문들이 많았습니다. 그래서 저희는 겁을 너무 먹었습니다.
게다가, 세션에서 학사 발표는 저희 팀이 유일했습니다. 실제로, 발표할 때 학사라고 밝히니깐 세션 좌장 교수님께서 굉장히 놀라시며 "학사가 여기를 도전할 생각을 하다니 대단하네요!"라고 하셨습니다. 학회 참여가 처음인데, 저희 팀이 너무 가벼운 마음으로 임했고, 전문적인 학회에 참여하지 않았나 생각이 들었습니다. 그래도, 학사라고 하시니깐 다행이도 다들 귀엽게 봐주시고, 칭찬도 많이 해주셨습니다.
또한, 세션 발표가 전부 끝나고 한 교수님께서 저희에게 오셔서 여기에 참여하게 된 계기도 여쭤보시고, 저희 "이음" 서비스에 대해서도 자세히 물어보고 가셨습니다. 정말 많이 부족한 발표이었는데도, 이렇게 많이 격려해주시고 관심을 가져주시니 너무 감사했습니다....
👂 학술대회에서 들은 내용들
저희 세션은 "AI 기반 추천 시스템"에 관련된 논문들을 모아둔 세션이었습니다. 추천 시스템은 실제 비즈니스에서도 관련이 깊은 주제이기 때문에 많이 귀담아 들을려고 노력했습니다. 다만, 제 AI 지식이 너무 얄팍해서 100% 완전히 이해하진 못했습니다... 저희 세션의 주제들은 아래와 같았습니다.
- 강화 학습 추천 시스템을 이용한 이점에 대한 소개
- Auto-Tagging을 이용한 관광에서 Personalized된 메뉴 추천
- 기업들이 탄소를 줄이기 위한 노력과 Cloud Computing간의 관계
등등 5~6개 정도의 발표가 있었습니다. 그중에서, 제일 관심 있었고 제대로 이해한 Auto-Tagging에 대해서 간단하게 소개드려보겠습니다.
Auto-Tagging이란, 구글에서 제안한 방법이며 사진 및 동영상 등에 자동으로 태그가 붙어서 이 태그를 바탕으로 사용자들에게 사진 및 동영상을 추천해주는 방식이라고 합니다. 그래서 이를 관광의 음식 분야에 적용해보자는게 논문의 주제였습니다. 현재, 메뉴 추천 시스템은 Unique한 메뉴에 대해서는 잘 추천을 못해준다고 합니다. 예시로 들었던 것이, "할머니의 30년 노하우가 담긴 비밀 짜장면"이었습니다. 그래서 이런 메뉴 같은 것은 면, 중식, 볶음과 같이 주재료, 조리법 소스 등등을 바탕으로 Auto-Tagging을 합니다. 이 시스템을 "Red Table"이라는 음식점 예약 앱에서 적용했다는데, 이 앱에 고객들이 음식을 먹었던 시간, 지역, 장바구니에 넣었다가 확정 짓는 시간 처럼 얼마나 확신을 가지고 먹기로 결정했는지 등 같은 데이터가 있으니, 이를 바탕으로 Personalized된 메뉴 추천을 해주는 방식이라고 합니다.
과거에 있던 음식 추천이랑 가장 큰 차이는, 기존 연구들은 "당신은 당뇨병이 있으니 어떤 재료를 먹어라"와 같이 재료 기반 요리 추천이었다고 합니다. 그래서, 해당 연구는 관광에서 고객의 과거 이력을 바탕으로 관광지의 음식을 어떻게 추천해줄 수 있는가?에 관한 것이라고 합니다. 꽤나 재밌는 이야기였습니다.
📌 마지막으로 할 말
일단, 학술대회가 처음이라 저희 팀들이 굉장히 긴장을 많이 했었습니다. 실제로, 앞서 언급했다 싶이 저희가 너무 가벼운 마음으로 참여했기도 하고, 너무 전문적인 학회를 선택했던 것 같습니다. 그럼에도 불구하고, 세션 교수님들께서 도전한 것을 칭찬하고, 격려해주시고, 부족한 저희 팀에 많이 관심을 가져주셔서 너무 감사합니다...
또한, 점점 AI가 강세가 되고 있는 상황에서 아무리 백엔드라 하더라도 어느정도 AI에 관한 지식과 역량이 필요하다 생각하는데, 너무 제 AI 지식은 얄팍했던 것 같습니다. 실제 여러 발표를 듣는데 따라가기가 버거웠습니다. AI 추천에 관련된 여러 발표 내용을 들으니 너무 좋았고, 앞으로도 점차 공부해나가야겠습니다.
이상 학술대회 회고를 마치겠습니다.
'활동 > 회고' 카테고리의 다른 글
[회고] 작심심주 오블완 챌린지 시작하기 (0) | 2024.11.06 |
---|---|
[회고] 캡스톤 졸업 프로젝트를 마치며 (feat. 외국민 프로젝트) - (2) (0) | 2024.06.23 |
[회고] 캡스톤 졸업 프로젝트를 마치며 (feat. 외국민 프로젝트) - (1) (1) | 2024.06.22 |
[회고] 우아한테크캠프 7기 테스트 회고 (0) | 2024.05.09 |