728x90
반응형

분류 전체보기 83

작사 LLM 제작 – 4. Suno AI와의 결합으로 곡 완성하기

앞선 3편에서는 QLoRA 방식으로 작사 LLM을 튜닝하고, 테스트를 통해 원하는 키워드 기반의 가사를 생성하는 과정을 살펴봤습니다.이번 편에서는 이렇게 생성된 가사를 Suno AI와 결합해 실제 곡으로 완성한 과정과 느낀 점을 공유합니다. 🎯 프로젝트 목표이번 작업의 목표는 간단합니다.“LLM이 생성한 가사가 실제로 노래로 완성될 수 있는지를 검증한다.” 이를 위해 최소한의 수정만 거쳐 작곡을 진행했습니다.즉, 원문에 가깝게 유지한 상태에서 음악적 완성도가 어느 정도 확보되는지 확인하고자 했습니다. 📝 가사 편집 과정작사 LLM이 생성한 결과물은 완벽하지 않았지만, 이번 프로젝트에서는 수정을 최소화했습니다.구체적으로는 노래로 부르기 자연스럽도록 마디(음절) 나누기만 적용했고,단어 선택이나 문..

LLM 2025.08.09

작사 LLM 제작 – 3. QLoRA를 통한 LLM 튜닝

앞선 2편에서는 각 가사에 대해 5개의 핵심 키워드를 추출하고, 이를 학습 데이터셋으로 정리하는 과정을 다뤘습니다.이번 글에서는 이 데이터셋을 활용하여 QLoRA 방식으로 소형 LLM을 튜닝하는 과정을 소개합니다. 📦 모델 준비모델은 로컬 환경에서 동작하도록 Hugging Face의 **gemma-2-2b**를 다운로드 후 사용했습니다.model_path = "./hug_model/gemma-2-2b/" 오프라인 환경에서도 모든 단계가 작동하도록 구성하는 것이 목표였기 때문에,모델 로드부터 데이터 처리, 학습까지 인터넷 연결 없이 수행할 수 있도록 세팅했습니다. 📊 데이터 불러오기 및 전처리전처리와 키워드 추출이 완료된 CSV 파일(keyword_lyric_train2.csv)을 로드하여 H..

LLM 2025.08.09

작사 LLM 제작 - 2. 키워드 추출과 데이터셋 구축

앞선 1편에서는 공개 가사 데이터셋을 전처리하여불필요한 문장과 이상치를 제거하고, 10,744개의 가사로 정제하는 과정을 다뤘습니다. 이번 글에서는 이 데이터를 기반으로 각 가사에서 핵심 키워드를 추출하고,LLM 학습에 사용할 수 있는 형태의 데이터셋으로 구축한 과정을 소개합니다. 💡 오프라인 작동을 위한 구조 설계이 프로젝트의 목표 중 하나는 다음과 같습니다:“인터넷 연결 없이도 작동하는 완전한 오프라인 작사 LLM 제작” 따라서 키워드 추출 또한 오프라인 상태에서 실행 가능한 모델로 구현해야 했습니다.이를 위해 Hugging Face에서 제공하는 경량 LLM인 google/gemma-2-2b 모델을 선택하여,로컬 환경에 다운로드한 후 모든 추출 작업을 진행했습니다. from transformer..

LLM 2025.08.08

작사 LLM 제작 - 1. 데이터 전처리

작사 LLM(Large Language Model)을 개발하기 위한 첫 걸음은 바로 신뢰할 수 있고 깔끔한 가사 데이터셋을 확보하고 전처리하는 과정입니다. 이번 글에서는 Kaggle의 공개 가사 데이터셋을 기반으로 진행한 전처리 과정을 소개합니다. ⚠️ 본 프로젝트는 비상업적 연구 및 실험 목적이며, 원본 가사 내용은 일절 공개하지 않습니다.사용된 데이터의 저작권은 원저작자에게 있으며, 본문에서는 오직 전처리 및 모델 학습 과정만을 다룹니다. 📘 1. 데이터 개요사용한 데이터는 Kaggle에서 공개된 가사 데이터셋으로, 총 11,399개의 곡에 대한 가사가 포함되어 있었습니다.모델 훈련을 위해 먼저 전처리 과정을 거쳤습니다. 🧹 2. 결측치 제거데이터프레임에는 'Lyric' 컬럼이 존재하며, ..

LLM 2025.08.08

[매뉴얼] 가스 밀도 계산기 beta 20250714

가스 밀도 계산기 beta 20250714 버전의 매뉴얼 입니다. [ 업데이트 사항 ] 1) 계산 가능 유체 추가 (11종)AmmoniaBenzeneCarbonMonoxideCarbonylSulfideKryptonMethanolNeonSulfurDioxideSulfurHexafluorideTolueneXenon2) 경고 메세지 추가온도, 압력 범위밀도계산 ① 가스 종류 선택창② 온도 입력창 (단위 : °C)③ 압력 입력창 (단위 : barA)④ 계산 및 그래프 보기 버튼⑤ 계산결과 출력 위치 [ 1 단계 ]'① 가스 종류 선택창'에사 가스 종류를 선택하고 '② 온도 입력창 (단위 : °C)' 과 '③ 압력 입력창 (단위 : barA)'에 단위에 맞는 값을 입력한 다음, '④ 계산 및 그래프 보기 ..

Gas Density 2025.07.14

[매뉴얼] 가스 밀도 계산기 beta 20250630

* 업데이트되었습니다. 아래의 글 목록에서 최신버전을 확인하세요!https://skydance.tistory.com/category/Gas%20Density 'Gas Density' 카테고리의 글 목록본 블로그는 금융/스포츠 데이터 분석과 엔지니어링 프로젝트 개발을 함께 다룹니다. 다양한 데이터 기반 인사이트을 공유하는 것이 목표입니다.skydance.tistory.com 가스 밀도 계산기 beta 20250630 버전의 매뉴얼 입니다. [ 업데이트 사항 ] 1) 기존 유체 명칭 수정O2 → OxygenN2 → NitrogenAr → Argon2) 계산 가능 유체 추가 (9종)CarbonDioxideEthaneHeliumHydrogenIsoButaneMethanen-Butanen-PropaneWate..

Gas Density 2025.06.30

경마장 경주로 구조 - 제주

제주 경마장의 경주로는 타원형으로 구성되어 있지만 서러브레드(더러브렛, Thoroughbred) 품종의 말로 경주를 진행하는 서울과 부산경남의 경주로와는 다르게 전통적으로 군마의 역할과 중기병의 역할까지 수행했던 품종이라서 그런지 경주로 전체에 걸쳐서 경사로가 급격하게 변하는 구조로 되어있고 말들이 달리는 방향도 서울 및 부산경남과는 반대 방향이며, 총 7개의 구간으로 되어있다. 1. 800m코너 진입 시점 : 약 150m유리한 유형 : 선행마 + 내측 게이트 → 빠르게 코너 선점불리한 유형 : 외곽 추입마 → 짧은 거리 + 고저차로 추입 어려움전개 포인트 : 순발력 + 가속 능력이 전부인 전형적인 단거리 순위 싸움2. 1,000m코너 진입 시점 : 약 350m유리한 유형 : 선행마 or 선입마불리한 ..

경마장 경주로 구조 - 부산경남

부산경남 경마장의 경주로는 타원형으로 구성되어 있지만 서울보다 직선구간의 거리가 길고 코너 구간의 곡률반경도 커서 전체적으로 서울의 경주로보다 전체적으로 큰 형태로, 총 9개의 구간으로 나뉜다. 또한 경사도 역시 서울보다 완만하기 때문에 경주마의 각질적성이나 게이트 위치에 따라 경주 성적에 미치는 영향도 서울에서의 경주와는 조금 달라진다. 1. 1,000m코너 진입 시점 : 출발 후 약 180m유리한 유형 : 내측 게이트 + 선행마 → 빠르게 코너 선점불리한 유형 : 외곽 게이트 + 추입마 → 전개 거리 손해전개 포인트 : 순발력 + 빠른 전개력이 핵심2. 1,200m코너 진입 시점 : 출발 후 약 250m유리한 유형 : 선입마 → 내리막으로 자연스러운 가속 가능불리한 유형 : 무리한 선행 or 외곽 추..

경마장 경주로 구조 - 서울

서울 경마장의 경주로는 타원형으로 구성되어 있으며, 총 8개의 구간으로 나뉜다. 경주 거리마다 출발 지점이 달라지기 때문에, 경주마의 각질적성이나 게이트 위치에 따라 경주 성적에 미치는 영향도 달라진다. 1. 1,000m코너 진입 시점 : 출발 후 약 130m유리한 유형 : 내측 게이트 + 선행마 → 코너 선점불리한 유형 : 외측 게이트 → 코너 진입 시 거리 손해 발생전개 포인트 : 1000m는 직선이 짧고 한 바퀴 미만으로 경주가 끝나므로 순발력 + 전개력이 핵심2. 1,200m코너 진입 시점 : 출발 후 약 250m유리한 유형 : 내측 게이트 + 선행 or 선입마 → 거리 이점 + 코너 선점불리한 유형 : 추입마 + 외곽 게이트 → 전개 불리, 외곽 코너로 더 뛰어야 함3. 1,400m코너 진입 시..

경주마의 각질적성(脚質適性) - 추입(追込)

각질적성 (脚質適性)'각질(脚質)'이란 경주마의 주행습성, 즉 레이스를 풀어나가는 달리기 방식을 일컫는 경마 용어다. 달리는 방식과, 그걸 이용한 경기 운영에 대한 적성으로, 도주 / 선행 / 선입 / 추입으로 나눠져 있다. 추입 (追込)추입마는 레이스 대부분을 최후방에서 주행하다가, 종반에 속도를 급격히 끌어올려 선두권을 추월하는 전략을 구사하는 말이다. 주로 최종 코너를 돌며 가속을 시작하고, 결승 직선에서 바깥쪽으로 크게 돌아 나오며 선두를 따라잡는다. 이러한 전개 방식의 가장 큰 특징은 폭발적인 라스트 스퍼트(종반 추격)이다. 네 가지 전개 유형 중에서도 가장 긴 거리와 강한 가속을 활용해 순위를 끌어올리는 유형으로, 종반의 질주력 하나로 승부를 보는 스타일이라 할 수 있다. 추입 전략의 가장 ..

728x90
반응형