[AI Hackathon] 2024 Upstage Global AI week AI Hackathon ํ๊ณ
Introduction
ํด๋น ํฌ์คํธ๋ Upstage์์ ์ฃผ์ตํ 2024 Global AI Week - AI Hackathon์์ Finalist๋ก ์ ์ ๋๊ธฐ๊น์ง์ ์ฌ์ ์ ํ๊ณ ํด๋ณด๊ณ , ๋ํ ๋น์ ์ฌ์ฉํ ๊ธฐ์ ๋ค์ ๋ํ ๋ด์ฉ์ ๋ด๊ณ ์์ต๋๋ค.
Global AI Week - AI Hackathon์ +43๊ฐ๊ตญ์์ ์ด +610๋ช ์ ์ฐธ๊ฐ์๊ฐ ์ฐธ์ฌํ์์ผ๋ฉฐ, Final 15ํ์ ๊ฒฝ์ฐ +13๊ฐ๊ตญ์ ํ์๋ค์ด ์ฐธ๊ฐํ์ต๋๋ค.
๋ณธ ๋ํ๋ 'AGI for Work': Utilize AI tech to address business challenges while enhancing efficiency and productivity ๋ผ๋ ์ฃผ์ ๋ฅผ ๋ฐํ์ผ๋ก ๋ค์ 5๊ฐ์ง์ tracks๋ก ๊ตฌ์ฑ๋์ด ์์ต๋๋ค.
- Finance
- Healthcare & Wellness Tech
- Legal
- Travel and Tourism
- Innovation (Etc topic)
๋ํ Offline Hackathon์ผ๋ก ์ง์ถํ๊ธฐ ๊น์ง ๋ค์ 3๊ฐ์ Round๊ฐ ์กด์ฌํ์์ต๋๋ค.
- Round 1 : Online Hackathon - Document Review
- Round 2 : Online Hackathon - Presentation (Top30)
- Round 3 : Offline Hackathon (Top15)

๋ํ์ ๊ด๋ จํ ์์ธํ ๋ด์ฉ์ Upstage Global AI Week AI Hackathon๋ฅผ ํตํด ํ์ธํ ์ ์์ต๋๋ค.
์ ๋ ์ ํฌ ๋ํ์ ์ฐ๊ตฌ์ค ์์ ์์ฌ๊ณผ์ ๋๋ฃ๋ค๊ณผ ํจ๊ป 'BISAI'๋ผ๋ ํ์ผ๋ก Healthcare & Wellness Tech track์ 'AI ์ฝ์ฌ ์ฑ๋ด'์ด๋ผ๋ ์์ด๋์ด๋ฅผ ๋ฐํ์ผ๋ก ๋ํ์ ์ฐธ์ฌํ์์ต๋๋ค. ์ผ๋ฐ ์ฝํ์ ๊ณผ๋ค๋ณต์ฉ์ ํฐ ์ํ์์๋ก ์กด์ฌํ๊ธฐ์ ์ด๋ฅผ ํด๊ฒฐํ๋ ์๋น์ค๋ฅผ ๋ง๋ค๋ฉด ์ด๋จ๊น๋ผ๋ ์๊ฐ์์ ํด๋น ์์ด๋์ด๋ฅผ ๊ตฌ์ํ๊ฒ ๋์์ต๋๋ค.

์ค์ ๋ฐ์ดํฐ๋ฅผ ๊ตฌ์ฑํ๋ ๋จ๊ณ์์ ์ฝํ ๋ฐ์ดํฐ์ ํ๊ณ๊ฐ ์กด์ฌํ์์๊ณ , ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ์ฝํ ๋์ , ์์์ ๊ณผ๋ค ๋ณต์ฉ ์ฌ๊ณ ์ฌ๋ก๋ฅผ ์กฐ์ฌํ๊ณ ์ ๋น์ฑ์ ๋ฐํ์ผ๋ก ์์์ ๊ณผ๋ค๋ณต์ฉ ๋ฐฉ์ง ์๋น์ค๋ฅผ ๊ฐ๋ฐํ๊ณ , ์ฝ์ฌ์ ์ฐ๊ฒฐํด์ค ์ ์๋ ์ฝ์ฌ ์ฑ๋ด ์๋น์ค๋ฅผ ์ถ๊ฐ๋ก ๊ฐ๋ฐํ์ฌ ๊ฐ์ด ์ ์ํ์์ต๋๋ค. ๊ทธ ๊ฒฐ๊ณผ Finalist์ ์ ์ ๋๋ ๊ฒฐ๊ณผ๋ฅผ ์ป์ ์ ์์์ต๋๋ค.
ํด๋น ์๋น์ค์ ๊ฒฝ์ฐ ๋ค์ Github Repository๋ฅผ ํตํด ํ์ธํ ์ ์์ต๋๋ค.

ํด๋น ์๋น์ค์ ๊ฒฝ์ฐ, ๋ค์ 4๊ฐ์ง์ API Key๋ฅผ ํ์๋ก ํฉ๋๋ค.
- Langchain API key
- OpenAI API key
- Upstage API key
- Predibase API key
๋ณธ ๋ํ์์ Project Impact์ Technical Implementation, Inovation & Creativity ๋ฟ๋ง ์๋๋ผ, Upstage์ Solar LLM๊ณผ Upstage API๋ฅผ ์ด๋ป๊ฒ ํ์ฉํ์๋๊ฐ๋ ์ค์ ํ๊ฐ์งํ๋ก ์ฌ์ฉ๋์์ต๋๋ค.
๊ทธ๋ผ ํด๋น ์๋น์ค๋ฅผ ๊ตฌ์ฑํ๋๋ฐ ์ฌ์ฉํ ๊ธฐ์ ์ ๋ํด ์ด์ผ๊ธฐ๋ฅผ ํด๋ณด๋๋ก ํ๊ฒ ์ต๋๋ค.
์ฌ์ฉ ๊ธฐ์ ์ ๋ฆฌ
- Upstage API : Solar LLM Fine-tuning, Generation, Embedding, Chat, OCR, and Groundness Check
- RAG & LangGraph
- Gradio
1. Upstage API : Solar LLM Fine-tuning, Generation, Embedding, Chat, OCR, and Groundness Check
์ด๊ธฐ ์จ๋ผ์ธ ํด์ปคํค ๋จ๊ณ์์๋ Upstage API๋ฅผ ์ฌ์ฉํ์ฌ Solar LLM Fine-tuning๊ณผ Generation, Embedding, Chat, Groundness Check๋ฅผ ์๋น์ค๋ฅผ ๊ตฌํํ์์ต๋๋ค.
Upstage API๋ ๋ค์ Upstage Console์์ ๋ฐ์ ์ ์์ผ๋ฉฐ, ๋ค์ํ ์ฌ์ฉ๋ฐฉ๋ฒ๋ค์ ์ ์ ๋ฆฌํด๋์๋๋ฐ์. ๋ณธ ๋ํ์์ ์ฌ์ฉํ ๋ฐฉ๋ฒ๋ค์ ๋ํด ์ดํด๋ณด๋๋ก ํ๊ฒ ์ต๋๋ค.
Solar LLM Fine-tuning
Solar LLM
์คํ๋ผ์ธ ํด์ปคํค ๋จ๊ณ์์ OCR๊ธฐ๋ฅ์ ์ถ๊ฐํ์์ต๋๋ค!
2. RAG & LangGraph
RAG(Retrieval Augmented Generation; ๊ฒ์์ฆ๊ฐ์์ฑ)
RAG(Retrieval Augmented Generation; ๊ฒ์์ฆ๊ฐ์์ฑ)๋ LLM์ด ๋ต์ ์์ฑํ๊ธฐ ์ ์ ๋ฒกํฐDB๋ ๊ฒ์์์ง์์ ๊ด๋ จ ๋ฌธ์๋ฅผ ๊ฒ์ํด Context๋ก ์ฃผ์
ํ ๋ค, ์ด๋ฅผ ๋ฐํ์ผ๋ก ๋ต๋ณ์ ์์ฑํ๋ ๋ฐฉ์์ผ๋ก, ์ฝ๊ฒ ๋น์ ํ์๋ฉด LLM์ ์ธ๋ถ ์ง์์ ๋ถ์ฌ์ "์ ์๋ ๋๋ฉ์ธ ๋น์"๋ก ๋ง๋ ๋ค๊ณ ์ค๋ช
ํ ์ ์์ต๋๋ค.
์ ํต์ ์ธ ํ์ธํ๋๊ณผ ๋ฌ๋ฆฌ, ๋ชจ๋ธ ์์ฒด๋ ๊ทธ๋๋ก ๋๊ณ ์ธ๋ถ ์ง์DB๋ง ์ ๋ฐ์ดํธํ๋ฉด ๋๊ธฐ ๋๋ฌธ์ ์ต์ ์ฑ ๋ฐ ๋๋ฉ์ธ ํนํ, ๋น์ฉ ์ธก๋ฉด์์ ํจ์จ์ ์ด๋ผ๊ณ ์๋ ค์ ธ ์์ต๋๋ค.
์ ํ์ ์ธ RAG์ ํ์ดํ ๋ผ์ธ์
- ๋ฌธ์ ์์ง/์ ์ (Document Collection/Preprocessing)
- Chunking & Embedding
- Vector indexing (Vector DB)
- ์ง์ ์ ์ ์ฌ๋ ๊ฒ์
- ๊ฒ์ ๊ฒฐ๊ณผ๋ฅผ Prompt์ ๋ถ์ฌ์ LLM ํธ์ถ
์์ผ๋ก ๊ตฌ์ฑ๋ฉ๋๋ค.
LangGraph
LangGraph๋
์คํ๋ผ์ธ ํด์ปคํค ๋จ๊ณ์์ ๊ธฐ์กด RAG & LangGraph์ ์ฑ๋ฅ์ ๊ณ ๋ํํ์์ต๋๋ค.
3. Gradio
๋ฐ๋ก ์ด์ ์ค๋ง์ผ๊ฒ์ดํธ ํด์ปคํค์์ ์ฌ์ฉํ Gradio๋ฅผ ์ฌ์ฉํ์ฌ ์ง์ ํ๋กํ ํ์ ์ ๊ตฌํํ์์ต๋๋ค. ๋น์์๋ ํ์์ด ์ฃผ๋์ ์ผ๋ก ์งํ์ ํ์๋ค๋ฉด, ๋น์ ๊ฒฝํ์ ์ด๋ ค ์ง์ ์ฐ๊ฒฐํ๊ณ ์๋น์ค๋ฅผ ๊ตฌํํ์์ต๋๋ค.
Gradio์ ๊ฒฝ์ฐ, Gradio ๊ณต์ ๋ฌธ์๋ฅผ ์ฐธ๊ณ ํ๋ฉด ๋ณด๋ค ์ฝ๊ฒ ๊ตฌํํ ์ ์์ต๋๋ค.
์ต์ข ํ๋กํ ํ์ ํํ
์๋ ์์์ ํตํด ์ ํฌ ํ๋ก์ ํธ ํ๋กํ ํ์ ์ ๋ชจ์ต์ ํ์ธํ ์ ์์ต๋๋ค.
[ํ๊ธฐ] ๋ํ๋ฅผ ๋ง๋ฌด๋ฆฌํ๋ฉฐ...
์ต์ข ๋ชฉํ์๋ Top3์๋ ์์ฝ๊ฒ๋ ์ ์ ๋์ง ์์์ง๋ง, Upstage์ Solar LLM์ finetuningํ๊ณ Upstage API, RAG, LangGraph, OCR์ ํ์ฉํ ๊ธฐ์ ์ ์ง์ ๊ฐ๋ฐํ๋ ๊ฒ์ ๋งค์ฐ ์๋ฏธ์์์ต๋๋ค.
์ด๋ฒ ๋ํ๋ฅผ ํตํด
- ๋จ์ํ ์๋ก์ด ๊ธฐ์ ์ ์ถ๊ฐํ์ฌ ์๋น์ค๋ฅผ ๊ฐ๋ฐํ๋ ๊ฒ๋ณด๋ค๋ ์ ์ ๊ฐ ์ด์ฉํ๊ธฐ ์ข์ ์๋น์ค๋ ๋ฌด์์ธ๊ฐ?
- ์๋น์ค์ ์์ฑ๋๋ ์ด๋์ ์ค๋๊ฐ?
- ์ค์ ์ฐ์ ํ์ฅ์์์ ๋ฐ์ดํฐ๋ฅผ ๋ฐํ์ผ๋ก ์ ์ ์ ๋์ฆ์ AI Engineer์ ์ญํ ์ ์ด๋ป๊ฒ ๋์ด์ผํ๋๊ฐ
- ์ค์ ํ์ต์ ์ํ ๋ฐ์ดํฐ๋ ์ด๋ป๊ฒ ๊ตฌ์ฑํ๊ณ , ํด๋น ๋ฐ์ดํฐ์ ์ ๋ขฐ์ฑ์ ์ด๋์ ์ค๋๊ฐ?
๋ฑ๊ณผ ๊ฐ์ ๊ณ ๋ฏผ๋ค์ ๋ํด ๊น๊ฒ ์๊ฐํ ์ ์์๋ ๊ฒ ๊ฐ์ต๋๋ค.
๋ํ ์ค์ ๊ฐ๋ฐ ํ๊ฒฝ์์ ๊ทผ๋ฌดํ๋ ๋ค์ํ ๋ฉํ ๋๊ณผ์ ์ปค๋ฎค๋์ผ์ด์ , ์ธ์ , ๋ ๋์๊ฐ ๋ค์ํ ๋๋ผ์์ ์ฐธ๊ฐํ ํ์๋ค๊ณผ์ ๋คํธ์ํน๋ ๋ณธ์ธ์๊ฒ ์์ด ํฐ ๊ฒฝํ๊ณผ ์์ฐ์ด ๋์๋ค๊ณ ์๊ฐํฉ๋๋ค. ๋ณธ ํฌ์คํ ์ ํตํด ๋ค์ํ๋ฒ ์ด๋ฌํ ๋ํ๋ฅผ ์ด์ด์ค Upstage์ ๊ฐ์ฌ๋๋ฆฝ๋๋ค.
๋ํ์ ๋ํ ํ๊ณ ๋ ์ด๊ฒ์ผ๋ก ๋ง๋ฌด๋ฆฌํ๊ณ , RAG์ ๋ํ ๋ด์ฉ๋ ์ถ๊ฐ ๊ณต๋ถ ํ ๋ธ๋ก๊ทธ์ ์
๋ฐ์ดํธํ ์์ ์
๋๋ค!
๊ธด ๊ธ ์ฝ์ด์ฃผ์
์ ๊ฐ์ฌํฉ๋๋ค!
์ ์๊ฒ ์ฐ๋ฝ์ ์ฃผ๊ณ ์ถ์ผ์ ๊ฒ์ด ์์ผ์๋ค๋ฉด
- LinkedIn : www.linkedin.com/in/sehoon-park-575b8b22a
- Github : https://github.com/sehooni
- Email : 74sehoon@gmail.com
- ๋ธ๋ก๊ทธ ๋๊ธ
์ผ๋ก ์ฐ๋ฝ ์ฃผ์๋ฉด ๊ฐ์ฌํ๊ฒ ์ต๋๋ค. :)
