본문 바로가기

DEVELOPMENT/TensorFlow

(4)
[TensorFlow] 워드 임베딩 텍스트 벡터화 기계 학습 모델은 벡터(숫자 배열)를 입력으로 사용한다. 텍스트로 작업할 때 가장 먼저 문자열을 숫자로 변환하는 벡터화 작업이 필요하다. 1. One-hot encodings 설명 단어를 이진 벡터로 표현하는 방법이다. 각 단어는 고유한 인덱스에 해당하는 위치에 1을 가지고, 나머지는 0으로 채워진 벡터로 변환된다. 장점 단어의 존재 여부를 표현하는 간단하면서도 효과적이다. 단점 단어 간의 의미적 관계나 유사성을 반영하지 못하며 벡터의 차원이 매우 크고 희소한 문제가 있다. 2. 각 단어를 고유 번호로 인코딩 설명 각 단어에 고유한 정수 인덱스를 할당하여 단어를 숫자로 표현하는 방식이다. 장점 단어를 효과적으로 컴퓨터가 처리할 수 있는 형태로 반환할 수 있다. 단점 단어 간의 의미적 관꼐나..
[TensorFlow] 기본 텍스트 분류 기본 텍스트 분류 🔎 개요 텍스트 분류(Text Classification)은 주어진 텍스트를 특정 카테고리들 중 하나로 분류하는 자연어 처리(NLP 분야의) 작업이다. TensorFlow는 텍스트 분류를 위한 다양한 기능과 도구를 제공한다. 📌 주제 영화 리뷰를 사용한 텍스트 분류 IMDB 데이터셋에 대한 감정 분석을 수행하도록 이진 분류기 훈련 📝 과정 ① 데이터셋 다운로드 및 탐색 ② 데이터셋 로드 ③ 훈련을 위한 데이터셋 구성 ④ 성능을 높이도록 데이터셋 구성 ⑤ 모델 생성 ⑥ 손실 함수와 옵티마이저 ⑦ 모델 훈련 ⑧ 모델 평가 ⑨ 정확도와 손실 그래프 그리기 ⑩ 모델 내보내기(새로운 데이터로 추론) 💻 개발환경 구글 코랩(Colab) : 클라우드 기반의 무료 Jupyter 노트북 개발 환경 Te..
[TensorFlow] 기본 이미지 분류 기본 이미지 분류 🔎 개요 이미지 분류(Image Classification)는 컴퓨터가 일련의 이미지를 분석하고 해당 이미지가 어떤 범주에 속하는지 판단하게 만드는 것을 말한다. TensorFlow를 사용하면 간단하게 이미지 분류를 시작할 수 있으며 커스텀 모델을 구현하여 더 복잡하고 구체적인 문제를 해결할 수 있다. 📌 주제 패션 MNIST 데이터셋을 사용하여 운동화나 셔츠 같은 옷 이미지를 분류하는 신경망 모델 훈련 📝 과정 ① 패션 MNIST 데이터셋 임포트 ② 데이터 탐색 ③ 데이터 전처리 ④ 모델 구성(층 설정, 모델 컴파일) ⑤ 모델 훈련(모델 맞추기, 정확도 평가, 예측) ⑥ 훈련된 모델 사용 💻 개발환경 구글 코랩(Colab) : 클라우드 기반의 무료 Jupyter 노트북 개발 환경 Te..
[TensorFlow] 텐서플로 2.0 시작하기 TensorFlow 1. TensorFlow 구글에서 개발한 오픈소스 딥러닝 프레임워크이다. 기계 학습 및 딥러닝 모델을 구축하고 실행하는데 사용된다. 딥러닝 모델을 만들기 위한 도구와 기능을 제공하여 개발자들이 모델을 훈련시키고 예측을 수행하는 과정을 쉽게 할 수 있도록 도와준다. 텐서플로는 이미지 인식, 반복신경망 구성, 기계 번역, 필기 숫자 판별 등 다양한 신경망 학습 작업에 사용된다. 이를 통해 이미지나 텍스트 등 다양한 데이터에서 패턴을 인식하고 예측하는데 활용된다. 텐서플로는 사용자에게 유연성과 성능을 제공하며, 대규모 데이터셋에서도 효율적으로 작동할 수 있다. 2. Tensor 텐서플로의 핵심 개념은 텐서(Tensor)이다. 텐서는 다차원 배열로, 숫자 데이터를 표현하는데 사용된다. 스칼라..