목록전체 글 (13)
차곡차곡 쌓아보는 개발 데이터_AI/ML engineer
맥북을 사용하는데, 어느 날 부터 MAC Spotlight 검색이 안되기 시작했다. cmd + space 조합으로 단축키 구성해놓고 쓰는 게 얼마나 편한지 모른다. 최근에 램을 엄청 잡아먹는 활성화 프로그램을 중단시켰는데 그게 스포트라이트 관련 프로세스 였나보다. ㅎㅎ; 아무튼 긴 말 생략하고 Spotlight 앱 검색이 안돼서 화날 땐 터미널 창을 켜보자. 그리고 아래 단계를 따라해보자. 1. Spotlight를 일시적으로 비활성화해주자. - Spotlight의 인덱싱 중지 sudo mdutil -a -i off 2. Spotlight의 인덱스를 삭제해보자. (나는 이 단계는 생략했다. 삭제할 파일이 없었기 때문) sudo rm -rf /.Spotlight-V100/* 3. Spotlight 인덱싱을..
논문 링크 : https://arxiv.org/abs/2201.08239 LaMDA: Language Models for Dialog Applications We present LaMDA: Language Models for Dialog Applications. LaMDA is a family of Transformer-based neural language models specialized for dialog, which have up to 137B parameters and are pre-trained on 1.56T words of public dialog data and web text. While m arxiv.org 해당 논문을 한국어로 번역 및 요약 정리 하였습니다. 저자 : Romal Th..
논문링크 : https://arxiv.org/abs/2302.07842 Augmented Language Models: a Survey This survey reviews works in which language models (LMs) are augmented with reasoning skills and the ability to use tools. The former is defined as decomposing a potentially complex task into simpler subtasks while the latter consists in calling external m arxiv.org 해당 논문을 한국어로 번역 및 요약 정리 하였습니다. 언어 모델(LM)을 확장 or 발전시키는 방법..

1. 불균형 데이터란? - 데이터의 비율이 균일하지 않고 한쪽으로 치우쳐진 데이터 범주형 데이터를 중점으로 ! 2. 불균형 데이터의 문제점 - 모델이 이상치에 편향된 경계 형태로 학습됨 : 모델이 분포도가 높은 클래스에 가중치를 많이 두기 때문 - 테스트 단계에서 오분류 확률 높음 - 모델 성능에 대한 왜곡 : 데이터 수가 많은 클래스에 대해서는 높은 정확도를 보이지만, 소수 클래스(이상 클래스)에 대해서는 잘 분류하지 못하는 모델로 학습됨 (부족한 클래스 데이터를 예측하는 데 실패 -> 전체적으로 봤을 때 이상 데이터 수가 작기 때문에 결과적으로 전체 Loss가 낮게 나옴) 3. 분류 task에 관한 불균형 해결 방안 Data-Level Under-Sampling 다수 클래스의 데이터를 임의 샘플링하여..

추천시스템(Recommendation System) - 사용자의 취향을 파악하여 관심을 가질만한 상품 등을 추천해주는 시스템 - 현재 대부분의 플랫폼에서 추천시스템을 적용한 개인 맞춤형 서비스 제공 추천시스템 종류 콘텐츠 기반 필터링(content based filtering) 사용자가 특정 아이템을 선호하면 그 아이템과 비슷한 콘텐츠를 가진 다른 아이템을 추천 ex) 사용자가 A 영화에 높은 평점을 줌 -> A영화와 비슷한 스릴러, 봉준호 감독의 다른 영화를 추천 협업 필터링(collaborative filtering) 사용자와 아이템간의 rating을 활용하여 사용자끼리의 유사도를 찾는 방식 특정 사용자와 비슷한 사용자를 찾은 후, 구매 이력 등의 행동 로그를 기반으로 예측하여 추천 ex) 사용자와 ..

추천시스템(Recommendation System) - 사용자의 취향을 파악하여 관심을 가질만한 상품 등을 추천해주는 시스템 - 현재 대부분의 플랫폼에서 추천시스템을 적용한 개인 맞춤형 서비스 제공 추천시스템 종류 콘텐츠 기반 필터링(content based filtering) 사용자가 특정 아이템을 선호하면 그 아이템과 비슷한 콘텐츠를 가진 다른 아이템을 추천 ex) 사용자가 A 영화에 높은 평점을 줌 -> A영화와 비슷한 스릴러, 봉준호 감독의 다른 영화를 추천 협업 필터링(collaborative filtering) 사용자와 아이템간의 rating을 활용하여 사용자끼리의 유사도를 찾는 방식 특정 사용자와 비슷한 사용자를 찾은 후, 구매 이력 등의 행동 로그를 기반으로 예측하여 추천 ex) 사용자와 ..

Intriduction - 해당 논문은 기존의 추천 시스템인 Markov Chains(MC) 와 RNN 계열 모델의 단점을 동시에 보완 - 제안된 모델은 기존의 추천시스템에서 좋은 성능을 보여주던 MC/CNN/RNN based model을 뛰어넘는 실험 결과를 보여줌 기존 sequential recommender Markov Chains (MCs) 유저의 다음 행동이 바로 이전의 과거 혹은 몇 개 이전의 행동에 영향을 받을 것이라는 가정으로 시작 이러한 가정은 너무 over-simplfy하고 매우 희소한(sparse) 데이터에만 잘 작동한다는 단점이 있음 따라서, 복잡한 관계를 학습하는 것은 힘듦 Recurrent Neural Networks (RNN) RNN 기반의 모델(대표적으로 GRU recomme..

곧 2022년이 끝난다. 나는 1년동안 무엇을 했고 잘 살아왔을까 ? 1년동안의 회고록을 작성해보려 한다. 일단 2022년의 마무리에서 내가 본 내 모습은 이렇다. ㅋㅋ 뚱땅뚱땅 첫 회고록 시-작 취준 2021년 12월 17일 종강을 하고, 자취방을 정리하며 많은 생각을 했었다. 이제 끝이구나.. 취업은 어떻게하지 ? 사실 처음은 막막했다. 놀면서도 한편으로는 취업에 대한 걱정이 컸다. 새로운 나날에 대한 기대 반 걱정 반. 어느 날, 잠들기 전 채용 공고를 보다가 아무 생각 없이 지원 버튼을 눌러보았다. 운이 매우 좋았던건지 다음 날 서류 통과 메일이 날아왔다. 서류 합격 - 과제 전형 - 1차 직무 면접 - 2차 임원 면접 으로 진행됐고 약 한 달 간의 긴 여정을 통과하고 최종 합류하게 되었다 ~~!..