전체 글64 [책] 시작! AWS 리뷰 클라우드 기술은 그동안 비용 절감과 개발 효율성 향상, 그리고 속도 개선을 목표로 발전해 왔습니다. 하지만 오늘날 클라우드는 AI, 빅데이터, IoT와 같은 첨단 기술들과 결합하여 기존 비즈니스와 시스템을 혁신하는 데 필수적인 도구로 자리 잡았습니다. 이러한 변화는 단순한 기술적 진보를 넘어서, 디지털 트랜스포메이션을 가능하게 하는 핵심 요소로 작용하고 있습니다. 여기서 AWS(Amazon Web Services)는 이러한 혁신의 중심에 서 있으며, 새로운 비즈니스 모델과 아키텍처를 구축하는 데 중요한 역할을 합니다. "시작! AWS"는 이러한 변화의 흐름 속에서 AWS에 처음 발을 들이는 입문자들에게 매우 유용한 지침서입니다. 이 책은 클라우드 컴퓨팅과 AWS의 기본 개념을 명확하게 설명하며, 온프레미.. 카테고리 없음 2024. 11. 17. [책] 머신러닝 인터뷰 실무 가이드 리뷰 '머신러닝 인터뷰 실무 가이드'는 데이터 사이언스와 머신러닝 분야에서 커리어를 시작하려는 이들에게 필수적인 지침서로 자리매김하고 있습니다. 이 책의 가장 큰 강점은 저자의 풍부한 실무 경험을 바탕으로 한 실질적인 조언에 있습니다. 저자는 인터뷰이와 인터뷰어 양쪽의 입장에서 겪은 경험을 상세히 공유하며, 독자들에게 인터뷰 과정에 대한 깊이 있는 통찰을 제공합니다. 이 책은 단순히 이론적인 지식을 나열하는 데 그치지 않고, 채용 프로세스 전반에 걸친 실용적인 가이드를 제시합니다. 이력서 작성부터 코딩 테스트, 기술 인터뷰, 그리고 행동 인터뷰에 이르기까지 각 단계별로 구체적인 준비 방법을 상세히 설명합니다. 특히 데이터 사이언티스트, 머신러닝 엔지니어, MLOps 엔지니어 등 각 직무별로 요구되는 역량과 인.. 서평 2024. 9. 8. [책] AI 딥 다이브 리뷰 딥러닝은 현대 인공지능 기술의 핵심으로, 그 본질은 단순하면서도 복잡한 양면성을 지닌 학문 분야입니다. 표면적으로 볼 때, 딥러닝 모델은 선형사상 함수와 비선형 활성 함수들을 계층적으로 쌓은 복합함수로 이해할 수 있습니다. 그 학습 과정도 미분 가능한 함수를 미분하는 것에 불과하며, 심지어 이 미분 작업조차 자동 미분 프로그램의 도움을 받아 수행됩니다. 이러한 기본적인 원리 때문에 열정적인 초보자라면 한 달 정도의 시간으로도 딥러닝의 기초를 파악할 수 있습니다. 그러나 딥러닝의 세계는 겉보기와 달리 그 깊이를 가늠하기 어려울 정도로 방대합니다. 일반화, 최적화 기법, 생성 모델, 메타 학습, 강화학습, 효율화 등 각 세부 주제마다 매년 수천 편의 논문이 발표되고 있습니다. 이러한 특성으로 인해 기본 개념.. 카테고리 없음 2024. 8. 25. [책] 실전 레디스 레디스(Redis)는 전 세계적으로 가장 널리 사용되는 NoSQL 인메모리 데이터 저장소임에도 불구하고, 국내에서는 관련 도서의 양이 절대적으로 부족한 실정이다. 이는 레디스의 초기 접근성이 매우 용이하고, 기본적인 활용만으로도 서비스 구성에 큰 문제가 없기 때문일 것이다. 하지만 이는 레디스의 진정한 잠재력을 충분히 활용하지 못하게 하는 요인이 될 수 있다. 이러한 배경에서, 본 도서는 레디스의 기초부터 실무 활용까지 폭넓게 다루며, 웹서비스 애플리케이션 개발자나 데이터베이스 관리자를 주요 독자층으로 삼고 있다. 레디스는 인메모리형 데이터 구조를 채택하고 있어 처리 속도가 매우 빠르면서도 영속성을 갖추고 있다. 또한 String, List, Hash, Set, Sorted Set 등 다양한 자료형을 지.. 서평 2024. 6. 15. [책] 개발자를 위한 커리어 관리 핸드북 개발자는 이직이 비교적 자유로운 직군 중 하나이지만, 개발자의 커리어 관리에 관한 책은 많지 않았다. 이러한 정보를 얻기 위해서는 커뮤니티나 오픈채팅 등 다양한 매체을 활용해야 했고, 최근에는 링크드인, 블로그, 깃허브 등을 통한 자기 PR의 중요성이 커지고 있다. 최근 한빛미디어에서 "머신러닝 인사이드 인터뷰"와 같은 면접 대비서부터 개발자의 커리어 관리에 도움이 되는 책을 출판한 것은 매우 반가운 일이다. 이 책의 초반부에서는, ‘뛰어난 관리자의 27가지 측면’이나 ‘효율적인 개발자의 42가지 습관’과 같이 구체적인 팁을 나열하는 대신, 커리어 개발과 관리를 위한 철학을 세 가지 항목으로 제시하고 있다. 이는 책의 중심 주제이며, 각 항목은 다음과 같다: 기술적인 방향성장실천 이 책은 관리자 직군이나.. 카테고리 없음 2024. 5. 26. [책] 챗GPT API를 활용한 챗봇 만들기 리뷰 ChatGPT가 우리에게 충격을 주었던 까닭은 ‘대화’라는 형식을 사용했기 때문이다. 인간이 사고하거나 세상과 소통하는 수단이 바로 언어이기 때문에 AI는 챗봇 형태로 발전할 가능성이 크다. 이 책은 자신만의 챗봇을 만들어가면서 Agent, Memory, Assistant API, 그리고 GPTs와 같은 기술들을 활용하여 자신만의 학습 스택을 구축해 나갈 수 있는 내용을 다룬다. 파이썬 기초 나만의 챗봇 만들기에 적합하게 쓸 만큼만 배우는 파이썬에 걸맞게 최소한의 파이썬 문법만 알려주고 있다. 간단한 데이터 타입 및 포맷팅 리스트, 딕셔너리, 셋, 튜플과 같은 컬렉션 조건문과 반복문, 함수, 클래스 그 밖의 데코레이터와 어노테이션, 타입 힌트 등을 설명하고 있다. 프롬프트 엔지니어링의 기초 프롬프트의 구.. 서평 2024. 4. 24. [책] 실무로 통하는 인과추론 with 파이썬 개요 새로운 프로젝트를 시작하거나 서비스를 도입할 때, 모델 선택, VRAM 용량, 자원 확보 등의 기술적인 요소들이 우선적으로 고려된다. 하지만 실제로 중요한 것은 주어진 일정 내에 서비스를 구현하거나 원하는 기능을 만드는 것만이 아니라 데이터 확보 및 관리, 외부 요인 분석 등의 인과추론 역시 성공적인 프로젝트를 위해 필수적인 역할을 한다. 성공적인 테크 기업들은 A/B 테스트, 스위치백, 통제집단합성법 등 다양한 인과추론 방법론을 적용하고 개발하여 시장, 제품, 사용자에 대한 이해를 높인다. 이러한 접근 방식은 까다롭고 복잡할 수 있지만, 기업의 성장과 발전에 필수적인 역할을 합니다. 이 책은 데이터 사이언티스트의 시각에서 인과추론의 기초부터 심화까지 다루는 전문 서적이다. 다양한 실제 사례를 통해.. 서평 2024. 3. 24. [책] 쉽고 빠르게 익히는 실전 LLM 리뷰 트랜스포머 아키텍처 2017년 Google Brain 팀에서 발표한 딥러닝 모델이다. 학계와 산업에서 다양한 자연처 처리 작업을 다루는데 표준이 되었다. LLM은 대부분 트랜스포머 아키텍처를 기반으로 한 AI 모델로, 간단한 텍스트 분류부터 텍스트 생성까지 다양한 언어 관련 작업을 높은 정확도와 유창하고 유려하게 수행할 수 있다. LLM이란 LLM에 대한 정의를 설명하기 위해 다음과 같은 특징들을 설명하고 있다. 시퀀스 투 시퀀스 인코더 디코더 자기회귀 모델, 자동 인코딩 모델, 자기회귀와 자동 인코딩의 조합 사전학습 (pre-training), 전이학습 (Transfer Learning), 파인튜닝 (Fine-Tuning) 정렬 + RLHF 등… BERT, GPT, T5와 같은 언어 모델부터 Align.. 서평 2024. 2. 24. [책] 팀 개발을 위한 Git, GitHub 시작하기(개정판) 리뷰 Git은 유명한 리눅스 창시자 리누스 토발즈가 리눅스의 소스 코드를 관리하기 위해 만들었다. 오늘날 Git은 빠른 응답성, 브랜치 관리의 편리함, 협업 뿐만 아니라 개인 작업 시에도 다양하게 사용되며, GitHub의 등장으로 Git은 개발자에게 필수적인 도구가 되었다. Git은 강력하고 편리하지만 여전히 입문자에게는 어려운 도구이다. 이 책에서는 소스트리를 이용하여 Git을 사용하는 방법을 설명한다. 1부에서는 GUI를 사용하고, 2부에서는 CLI를 사용한다. 입문자는 1부 GUI 부분만 익히면 Git과 GitHub를 사용하는 데 큰 어려움이 없을 것이다. 재미있는 사실은 책에서는 고작 8개의 CLI 명령어를 사용하지만 우리가 실무에서 사용할 거의 모든 것이라는 점이다. 이 책의 장점은 다음과 같다. G.. 서평 2023. 6. 25. [책] 추천 시스템 입문 AI에 의한 초개인화는 지난 2020년부터 일정한 트렌드로 자리잡고 있다. ‘개인화’가 애플리케이션에 의해 데이터를 기반으로 알고리즘을 만드는 것이라면, ‘초개인화’는 개인의 취향이나 관심사를 반영해 맞춤형 서비스를 제공한다는 점에서 다르다. 따라서 ‘초개인화’ 시대에 걸맞은 추천 알고리즘을 기업의 필수적인 마케팅 요소로 꼽고 있다. 대표적인 추천 알고리즘에는 콘텐츠 기반 필터링과 협업 필터링이 있다. 이 책에서는 더불어 회귀, 행렬 분해, LDA, Word2Vec, 딥러닝을 활용한 방법 등을 실습을 통해 소개하고 있다. 하지만 조심해야 할 부분도 있다. 필요 이상 고도의 알고리즘을 선택하지 않도록 의식하는 것이 중요하며, 과도한 개인화는 사용자가 스스로 인식한 것 이상으로 서비스에 정보를 빼앗기고 있다.. 서평 2023. 5. 27. [책] 머신러닝 시스템 설계 서론 몇 년 전부터 전 세계적으로 MLOps는 AI 개발에서 큰 화제가 되고 있다. 스탠퍼드 대학의 ‘앤드류 응(Andrew Ng)’ 교수는 MLOps에 대해서 다음과 같이 말했다. 모델 중심 AI 시대가 아닌 데이터 중심의 AI 시대가 도래할 것이다. 따라서 체계적인 데이터 관리를 위해 MLOps가 중요하다. 그렇다면 MLOps란 무엇일까? MLOps는 ML 시스템 개발(Dev)과 ML 시스템 운영(Ops)을 통합한 것으로, 데이터 레이블링의 일관성을 위해 인프라를 만들어 자동으로 운영되도록 만드는 역할을 한다. 데이터의 품질을 높이려면 데이터의 양만큼이나 질도 중요하기 때문에 데이터를 체계적으로 관리하고 개선시키는 MLOps의 중요성이 강조되고 있다. 이 책은 스탠퍼드 대학의 ‘CS 329S: Mac.. 서평 2023. 4. 23. [논문] BART 리뷰 요약 분야에서 BERT와 같은 인코더 모델은 원본 텍스트의 일부 문장을 선택하는 추출 요약에서 우수한 성능을 보이지만, 텍스트를 생성해야 하는 생성 요약에는 적합하지 않다. 반면, GPT와 같은 디코더 모델은 텍스트 생성에는 적합하지만, 학습 시 단방향의 정보만을 이용하는 단점이 있다. 이러한 이유로 생성 요약과 같은 태스크에는 인코더와 디코더를 활용한 사전학습된 시퀀스 투 시퀀스 모델을 사용한다. 이러한 모델의 시초가 되는 BART에 대해 알아보자. 0-1. Abstract & Introduction BART는 본질적으로 인코더와 디코더가 있는 트랜스포머 모델이다. 임의의 노이즈 함수로 손상된 텍스트를 인코더에 입력하고 인코더는 주어진 텍스트의 표현을 학습시키고 그 표현을 디코더로 보낸다. 디코더는 인.. 딥러닝/NLP 2023. 3. 24. 이전 1 2 3 4 ··· 6 다음 반응형