
2020 데이터 청년 캠퍼스가 끝났습니다! 연세대에서 2달 가량 좋은 교육을 받았고 (비대면 진행), 프로젝트 또한 좋은 팀원분들을 만나서 질 좋은 프로젝트를 진행할 수 있었습니다. 저희 팀은 '한국 지방소멸에 관한 탐색과 극복 방안에 관한 연구' 라는 주제로 지방 소멸화에 대한 예측과 해결방안에 대한 정성적인 분석을 진행하여 연세대학교에서 1등을 차지했습니다 ㅎㅎ 이후 대학 대항전에 나가서 최종으로 최우수상인 '한국데이터산업진흥원장상' 을 끝으로 좋은 성적을 받게 되었습니다 :) 아쉽지만...사실 저는 현재 진행하고 있는 인턴과 겹치게 되어 수료를 못하게 되었습니다 ㅠㅠ (원장상 안녕..) 물론 제 결정에 따른 결과이지만 많이 아쉽긴 합니다..ㅎ 그래도 좋은 경험이었고, 특히 팀장님께서 행정학이라는 도..

보아즈의 마무리 ADV 프로젝트가 시작되었다. (사실 8월부터 시작되었다..) 많은 팀들 중 자연어처리 태스크를 다루는 팀은 우리팀이 유일하다. 재미와 실용성 사이에서 여러 시행착오를 거친 후 간단하면서 재밌고, 실용성도 높은 편인 스포일러 댓글을 분류하는 모델을 만들어보기로 하였다. 사실 여러 이유(핑계)들로 인해 시작이 많이 늦어졌지만 그만큼 더 열심히 진행하고 있다 .. :) 스포일러 분류라는게 언뜻보면 간단한 이진분류 태스크로 보이지만 생각보다 쉽지 않았다. 기존 많은 모델들과 레퍼런스가 있는 '악성 댓글 분류'와는 내용이 많이 달랐다. 전체적인 그림을 그리기에 앞서 '스포일러' 자체의 특징을 파악하는게 우선이라고 생각했다. 악성 댓글이라는 것은 그 기준이 명확히 정해져있지만 (방통위 등), 스포..

본 커널은 Porto Seguro의 금메달 EDA 커널을 쉽게 이해하도록 작성한 Korean Starter들을 위한 커널입니다. 대부분의 내용은 이미 공개되어 있는 커널이며 이해하기 쉽게 한글로 번역, 설명을 추가한 커널입니다 참고 부탁드립니다. 본 커널은 비식별 Feature를 사용하는 대회의 EDA를 위한 커널로, 모델링 및 submission은 진행하지 않습니다. 초보자의 입장에서 초보자분들을 위해 커널을 작성하는 만큼, 쉽게 설명하고자 하였습니다. 데이터를 이해함에 있어서 큰 도움을 주신 참고 코드 작성자 분께 감사합니다 :) 금메달 커널 원본: https://www.kaggle.com/bertcarremans/data-preparation-exploration Data Preparation & ..

Tableau를 이용하여 만들어본 TESLA 차량 모델 대시보드입니다. 차량 png 이미지 파일은 네이버, 테슬라 홈페이지에서 수집했으며, 테슬라 관련 데이터들은 네이버 차량 정보에서 수집하였습니다. 가장 손이 많이 간 부분은 3D 모델링 부분입니다. 3D 모델 위에 3개의 슬라이더를 통해 3차원으로 축을 움직이며 3D 차량을 살펴볼 수 있습니다. 3D 모델을 태블로에 사용하는 방법은 추후 포스팅하도록 하겠습니다! 우측 위에 있는 드롭다운을 통해 모델별 제원을 살펴보도록 하고, 모델의 사진도 변경되도록 하였습니다. 데이터가 많은 편이 아니다보니, 많은 시각화를 보여주기보다 디자인 측면에 좀 더 신경을 써서 제작하였습니다. 추후 하이라이트 작업과, 가능하다면 3D 모델의 좌표들을 이용하여 부품별 가격을 시..

본 커널은 Porto Seguro의 금메달 EDA 커널을 쉽게 이해하도록 작성한 Korean Starter들을 위한 커널입니다. 대부분의 내용은 이미 공개되어 있는 커널이며 이해하기 쉽게 한글로 번역, 설명을 추가한 커널입니다 참고 부탁드립니다. 본 커널은 비식별 Feature를 사용하는 대회의 EDA를 위한 커널로, 모델링 및 submission은 진행하지 않습니다. 초보자의 입장에서 초보자분들을 위해 커널을 작성하는 만큼, 쉽게 설명하고자 하였습니다. 데이터를 이해함에 있어서 큰 도움을 주신 참고 코드 작성자 분께 감사합니다 :) 금메달 커널 원본: https://www.kaggle.com/bertcarremans/data-preparation-exploration 작성자 커널 원본: https://..

이번 포스팅은 Konlpy 라이브러리의 여러 토크나이저들과 그 성능을 비교해보는 시간을 가져보겠습니다! 또한 Konlpy와 별개로 추가 설치를 해야하는 Mecab 토크나이저의 설치 방법도 다뤄보도록 하겠습니다. 아래의 내용은 이기창님의 '한국어 임베딩' 도서의 내용을 참고하였습니다. 출처: https://ratsgo.github.io/ ratsgo's blog · for textmining Original Artwork © Pablo Picasso. Girl before a Mirror. Boisgeloup, March 1932. Oil on canvas ratsgo.github.io 윈도우 사용자 Mecab 설치 방법 mecab-ko-msvc 설치 1-1. https://github.com/Pusnow..