분류 전체보기59 한국어 임베딩 - 서론 임베딩이란 자연어 처리 분야에서 임베딩이란, 사람이 쓰는 자연어를 기계가 이해할 수 있는 숫자의 나열인 벡터로 바꾼 결과 혹은 그 일련의 과정 전체를 의미한다. 단어나 문장 각각을 벡터로 변환해 벡터 공간으로 '끼워 넣는다(embed)'는 의미에서 임베딩이라는 이름이 붙었다. 임베딩이라는 개념은 자연어 처리 분야에서 꽤 오래전부터 사용한 것으로 보인다. 하지만 본격적으로 통용되기 시작한 것은 딥러닝의 대부 요슈아 벤지오 연구 팀이「A Neural Probabilistic Language Model」(Bengio et al., 2003)을 발표하고 나서부터다. 임베딩의 역할 임베딩은 다음 역할을 수행할 수 있다. 단어 / 문장 간 관련도 계산 의미적 / 문법적 정보 함축 전이 학습 단어 / 문장 간 관련도.. 딥러닝/NLP 2022. 9. 19. [책] SQL로 시작하는 데이터 분석 지금은 예전에 비해 데이터 분석이 매우 대중화됐다. 데이터 분석 기법과 관련된 자료를 찾기도 쉽고, 정부에서 공개한 공공 데이터나 캐글에 공개된 데이터를 분석한 자료도 많다. 하지만 자료에 데이터 마이닝 알고리즘, 머신러닝, 수학, 통계와 관련된 자료도 뒤섞여 있어 데이터 분석에 첫걸음 내딛는 사람이 참고하기에는 너무 어려운 경우가 많다. 이 책은 이제 막 SQL 문법을 공부한 사람이 데이터 분석을 실습하기에 적당한 기본 데이터 분석 기법을 다룬다. 데이터 삽입, 수정, 삭제보다는 SELECT 문을 활용해 데이터를 원하는 대로 분석하는 데 집중한다. 시계열 분석, 코호트 분석, 이상 탐지, 실험 분석 및 새로운 데이터 생성 방법까지, 실제 데이터 분석에 널리 쓰이는 기법을 입문자 눈높이에서 설명한다. 이.. 서평 2022. 8. 28. [Error] MongoDB - mongod.service: Failed with result 'exit-code'. (code=exited, status=14) 환경은 Ubuntu 20.04 환경입니다. 다음과 같은 에러가 발생할 시, sudo chown -R mongodb:mongodb /var/lib/mongodb sudo chown mongodb:mongodb /tmp/mongodb-27017.sock sudo service mongod restart Error 2022. 7. 29. [책] 파이썬을 활용한 베이지안 통계 2판 이 책은 기존의 파이썬을 활용한 베이지안 통계를 개정한 개정판이다. 개정판은 무려 8년 만에 나왔으며, 5개의 챕터가 추가된 20개의 챕터로 이루어져 있다. 따라서 책 페이지도 거의 2배가 되었다. 베이즈 정리에 관한 책은 머신러닝 엔지니어가 되기 위해 조금 더 전문적이고 이론적인 공부가 필요할 때 꼭 필요한 책이다. 따라서 이 책을 읽기전에 미적분학이나 선형대수학을 알 필요는 없지만 넘파이나 판다스 등 파이썬에 익숙해야 한다고 권장한다. 베이즈 정리는 조건부 확률에 사전확률을 활용하여 통계적 추론을 하는 방법이다. 따라서 1장은 조건부 확률로 시작하여 베이즈 정리를 도출한다. 베이지안 통계의 기본은 베이즈 이론이고, 베이즈 이론의 기본은 조건부 확률이다. 베이즈 이론은 오늘날 머신러닝에 사용되는 예측 .. 서평 2022. 7. 24. [책] 쉽게 따라하는 NFT 마스터 가이드 모든 것의 시작은 비트코인이다. 2021년 말, 비트코인의 가격이 다시 한번 상승하면서 암호화폐에 대한 사람들의 관심이 높아졌다. 비트코인에 향하던 대중의 관심은 자연스럽게 NFT로 옮겨와 NFT에 대한 검색량도 급증하게 되었다. 이 책은 총 4부이며 13개 장으로, 구성은 다음과 같습니다. 1부는 NFT에 대한 대략적인 정보를 소개하고 간단한 구매 방법과 현황을 다루고 있습니다. 달러나 주식, 비트코인은 상호 대체할 수 있지만 NFT는 대체 불가 토큰(Non-Fungible Token)을 의미합니다. 또한, 탄탄하고 검증된 블록체인으로 보호받으며 현재까지 이더리움 블록체인은 해킹된 적이 없습니다. 이러한 안전성을 기반으로 블록체인을 대중화한 NFT는 다양한 사람들에게 접근성을 높이고 그 가치를 크게 상.. 서평 2022. 6. 21. docker command를 sudo 키워드 없이 사용하는 방법 docker 관련 command를 sudo 키워드 없이 사용할 수 있도록 다음 명령어를 실행하여 권한을 추가한다. sudo groupadd docker sudo usermod -aG docker $USER newgrp docker docker run hello-world 카테고리 없음 2022. 6. 18. [Error] minikube start error - Exiting due to HOST_JUJU_LOCK_PERMISSION: Failed to start host: boot lock: unable to open /tmp/juju-mkc8ab01ad3ea83211c505c81a7ee49a8e3ecb89: permission denied minikube start 이후 다음 에러가 발생할 시, Exiting due to HOST_JUJU_LOCK_PERMISSION: Failed to start host: boot lock: unable to open /tmp/juju-mkc8ab01ad3ea83211c505c81a7ee49a8e3ecb89: permission denied 아래 명령어 실행 sudo sysctl fs.protected_regular=0 Error 2022. 6. 18. [Error] minikube unable to open /tmp/juju-mkb7aeee46cbc538b25888dfad3e62407ad50c5a: permission denied 에러 minikube kubectl -- config view --flatten Error caching kubectl: failed to acquire lock "/root/.minikube/cache/linux/v1.21.7/kubectl.lock": {Name:mkb7aeee46cbc538b25888dfad3e62407ad50c5a Clock:{} Delay:500ms Timeout:1m0s Cancel:}: unable to open /tmp/juju-mkb7aeee46cbc538b25888dfad3e62407ad50c5a: permission denied 위와 같은 에러 발생 시 다음 명령어 실행 sudo rm -rf /tmp/juju-mk* sudo rm -rf /tmp/minikube.* Error 2022. 6. 18. [책] XGBoost와 사이킷런을 활용한 그레이디언트 부스팅 저도 데이콘에서 데이터가 많이 없는 경진대회의 경우 머신러닝 모델을 많이 사용합니다. 그중에서도 XGBoost, LightGBM, Catboost 등을 애용하고, 이들을 스태킹 하는 방법을 주로 사용합니다. 이 책도 XGBoost에 대해 중점적으로 다루고 있지만 새로운 특성을 만드는 피처 엔지니어링, 앙상블, 스태킹 등 캐글 대회에서 상위권을 노릴 수 있는 강력한 머신러닝 기법들을 소개하고 있습니다. 이 책은 그레이디언트 부스팅을 크게 업그레이드시킨 모델로 정확도와 속도를 달성하기 위해 계산량을 극대화한 XGBoost에 대해서 소개하고 있다. 캐글 대회에서 압도적으로 우승을 많이 한 모델로 아직까지도 사랑받고 있는 모델 중 하나이다. 이 책의 핵심 주제는 XGBoost의 구조, 기능, 성능이지만 1장에서.. 서평 2022. 5. 29. [error] RuntimeError: CUDA error: no kernel image is available for execution on the device 에러 [Ubuntu 20.04] [error] RuntimeError: CUDA error: no kernel image is available for execution on the device 위의 에러는 파이토치 버전과 CUDA 버전의 호환성 에러이다. 실행 환경 : Ubuntu 20.04 / RTX 3060 / CUDA 10.1 1. 먼저 나의 GPU 사양을 확인한다. nvidia-smi --query | fgrep 'Product Name' 2. https://developer.nvidia.com/cuda-gpus#compute 로 이동 3. CUDA - Enabled GeForce and TITAN Products 선택 4. 나의 GPU 에 맞는 Compute Capability 를 확인한다. 5. 터미널을 열고 다음 명령어 .. 카테고리 없음 2022. 5. 17. [책] 케라스로 구현하는 딥러닝 2010년 중반부터 AI 가 다시 부흥하더니 최근 2 ~ 3년 간은 AI 의 열풍이다. 코딩 학원의 갯수만큼 엄청나게 많은 머신러닝 / 딥러닝 책이 출판되었다. 좋은 책들은 3 ~ 4년이 지나도 계속해서 회자되는 책들이 있는 반면, 그만큼 빠르게 잊혀가는 책도 많아졌다. 처음엔 이 책을 받고, 흔한 딥러닝 입문서이지 않을까 생각하였다. 너무나 많은 딥러닝 책이 나와 있고, 필독서라고 할만큼 유명한 책들도 꽤나 많기 때문이었다. 다만, 흥미로웠던 점은 이론은 굉장히 최소화하였다는 점과 케라스로 구현한 점이었다. 요즈음 나오는 책들은 대부분 Tensorflow 또는 Pytorch 로 구현되기 때문이다. 케라스는 Tensorflow 위에서 동작하는 라이브러리이지만, Tensorflow 보다는 좀 더 사용자 친.. 서평 2022. 4. 24. [책] 미국 주식으로 시작하는 슬기로운 퀀트투자 코로나 19 이후 주식투자 열풍으로 주식 투자자가 엄청나게 늘었다는 뉴스를 본 적이 있다. 물론 필자도 2020년부터 주식투자를 시작하였다. 특별히 전략이 없어도 높은 수익을 거둘 수 있었던 증시 호황기였지만, 지금은 시장이 달라졌다. 미국의 금리 인상, 러시아-우크라이나 전쟁 등 다양한 요인이 증시에 영향을 주고 있다. 사람들은 자연스레 안전 자산을 찾게 되고 금, 채권, 달러의 환율이 치솟게 되었다. 이때 우리에겐 바로 이 퀀트 투자가 필요하다. 퀀트 투자란 오로지 ‘숫자’에만 기반해 투자 결정을 내리는 방식이다. 저(低)주가수익비율(PER·주가/주당 순이익)과 저주가순자산비율(PBR·주가/주당 순자산),주가매출액비율(PSR·주가/주당 매출), 주가현금흐름비율(PCR·주가/주당 영업현금흐름) 등 숫자.. 서평 2022. 3. 27. 이전 1 2 3 4 5 다음 반응형