소리란?소리는 물체의 진동이 매질(공기, 물, 고체 등)을 통해 전달되며, 에너지가 이동하면서 발생합니다. 예를 들어, 목소리는 성대의 진동으로 공기 분자가 압축과 팽창을 반복하며 전달됩니다.이때 소리는 파형(Waveform)으로 시각화할 수 있습니다. 이는 시간에 따른 공기압 변화를 나타내며, 주요 특성으로 주파수(Frequency)와 진폭(Amplitude)가 있습니다. 주파수는 음의 높이를, 진폭은 소리의 크기를 결정합니다.Y축은 진폭(Amplitude) , X축은 시간(Time) 입니다.주기와 주파수의 개념 및 관계 Period (주기): 주기는 반복적인 파동이나 진동에서 특정 지점에서 같은 상태가 다시 나타날 때까지 걸리는 시간을 의미합니다. 단위는 초(s)로 표현됩니다. 예를 들어, 진동이 1..
전체 글
잡다한거 정리해서 포스팅하는 블로그RNN(recurrent neural network)RNN(Recurrent Neural Network)은 시계열 데이터를 처리하기 위해 고안된 모델로 아래 그림에서와 같이 이전 시각(계층)의 출력 값(은닉 값)이 다음 시각(계층)으로 전파되어 즉, 과거 정보를 계승하여 시계열 데이터에 대응하는 신경망입니다. RNN의 문제점장기 의존성 문제RNN의 은닉층에서 과거의 정보와 현재의 input이 합쳐지면서 진행되는데 이때 과거의 정보가 마지막까지 전달 되지 않는 문제를 장기 의존성 문제라고 합니다.아래의 수식처럼 현재의 입력과 과거의 정보를 더해 활성화 함수 탄젠트를 취해주는데, 함수는 값이 -1에서 1사이에 위치하게 됩니다.문제는 역전파를 통한 가중치 업데이트 과정에서 반복적으로 기울기에 곱해지 보면 점점..
개요LLM 서비스 준비로 인해 NLP의 기본 개념인 토큰화, 임베딩에 대해서 학습한 내용을 정리 하였습니다. 토큰화의 개념tokenization (토큰화)텍스트 데이터를 컴퓨터가 처리할 수 있도록 변환하는 과정문장이나 문서를 모델이 처리할 수 있는 작은 단위(토큰)로 분할하는 과정토큰화 주요 종류N-gram: 연속된 n개의 아이템을 하나의 토큰으로 취급합니다. 이는 텍스트 내에서 아이템의 연속성을 포착하는 데 유용합니다.Character: 개별 문자를 독립적인 토큰으로 취급합니다. 이 방법은 언어의 구조적 특성을 덜 고려하며, 매우 세밀한 수준의 분석이 가능합니다.Word: 공백이나 구두점 등을 기준으로 분리된 ‘단어’를 토큰으로 사용합니다. 가장 일반적이고 직관적인 방법입니다.Morpheme: 형태소 ..
글또를 시작하며학교를 졸업하기 직전인 2021년 글또 6기부터 참여하며 약 3년의 시간이 흘렀습니다. 이 기간 동안 내가 더 나은 사람이 되었는지 되돌아보면, 무엇보다 생각하는 방식이 많이 바뀌었다고 느낍니다. 특히 업무를 바라보는 관점과 대하는 태도에서 큰 변화가 있었습니다. 이번 글에서는 이러한 생각의 전환을 이끈 경험들에 대해 이야기해보려 합니다.생각의 전환이 된 계기첫 번째 회사2021년 12월, 저는 헬스케어 도메인의 스타트업에 취업했습니다. 이곳에서 뇌혈관의 정량적 데이터를 측정하고 분석하는 의료기기를 개발하고 연구하는 업무를 맡았습니다. 주된 업무는 의료 데이터를 분석하고, 통계를 통해 나온 결과를 보고하며, Computer Vision 기술을 활용해 세그멘테이션 알고리즘을 개선하는 것이었습..