๐ Ollama vs PyTorch/transformers
PyTorch ์ง์ ์ฌ์ฉ
- โ ์ฅ์ : ๋ชจ๋ธ ๊ตฌ์กฐ์ ์ง์ ์ ๊ทผ, ์ธ๋ฐํ ์ ์ด ๊ฐ๋ฅ
- โ ๋จ์ : ๋ณต์กํ ์ค์ , GPU ๋ฉ๋ชจ๋ฆฌ ๊ด๋ฆฌ, ๋ชจ๋ธ ๋ก๋ฉ ์๊ฐ ์ค๋ ๊ฑธ๋ฆผ
- ๐ฆ ํน์ง: Transformers ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ก ๋ชจ๋ธ์ ์ง์ ๋ค์ด๋ก๋ํ๊ณ ๋ฉ๋ชจ๋ฆฌ์ ๋ก๋ฉ
Ollama ์ฌ์ฉ
- โ ์ฅ์ : ๊ฐ๋จํ ์ค์ , ์๋ ์ต์ ํ, ๋น ๋ฅธ ์์, ๋ชจ๋ธ ๊ด๋ฆฌ ํธ๋ฆฌ
- โ ํน์ง: ์๋ฒ-ํด๋ผ์ด์ธํธ ๊ตฌ์กฐ, ์์ํ ์๋ ์ ์ฉ, ๋ฉ๋ชจ๋ฆฌ ํจ์จ์
- ๐ ์ต์ ํ: C++๋ก ์์ฑ๋ llama.cpp ์์ง ์ฌ์ฉ (๋ ๋น ๋ฆ)
# ollama ์ค์น
curl -fsSL https://ollama.com/install.sh | sh
# llama3.2 1B(๊ฐ์ฅ ์์ ๋ชจ๋ธ) ์ค์น
ollama pull llama3.2:1b
๐ Ollama vs PyTorch/Transformers ๋น๊ตํ
| ๊ตฌ๋ถ | ๐ฆ Ollama | ๐ PyTorch/Transformers |
| ์ํคํ ์ฒ | ํด๋ผ์ด์ธํธ-์๋ฒ ๊ตฌ์กฐ | ์ง์ ๋ผ์ด๋ธ๋ฌ๋ฆฌ ํธ์ถ |
| ํต์ ๋ฐฉ์ | HTTP API (REST) | Python ํจ์ ํธ์ถ |
| ๊ธฐ๋ณธ ํฌํธ | 11434 | ์์ (์ง์ ํธ์ถ) |
| ์ค์น ๋ฐฉ๋ฒ | ์์คํ ๋ฐ์ด๋๋ฆฌ ์ค์น | pip install |
| ๋ชจ๋ธ ๊ด๋ฆฌ | ollama pull <model> | HuggingFace Hub ์๋ ๋ค์ด๋ก๋ |
| ๋ชจ๋ธ ์ ์ฅ ์์น | /usr/share/ollama/.ollama/models/ | ~/.cache/huggingface/hub/ |
| ๋ชจ๋ธ ํ์ | GGUF (์์ํ๋ ํ์) | PyTorch (.bin, .safetensors) |
| ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ | ์๋ฒ ํ๋ก์ธ์ค๊ฐ ๊ณต์ ๊ด๋ฆฌ | ๊ฐ Python ํ๋ก์ธ์ค๋ง๋ค ๋ก๋ |
| ์ด๊ธฐํ ์๊ฐ | ์๋ฒ ์์ ํ ์ฆ์ ์ฌ์ฉ | ๋งค๋ฒ ๋ชจ๋ธ ๋ก๋ฉ ํ์ |
| ๋์ ์ฌ์ฉ | ์ฌ๋ฌ ํด๋ผ์ด์ธํธ๊ฐ ํ๋์ ์๋ฒ ๊ณต์ | ๊ฐ๊ฐ ๋ ๋ฆฝ์ ์ผ๋ก ๋ชจ๋ธ ๋ก๋ |
| ์ฑ๋ฅ | C++/Go ๊ธฐ๋ฐ, ๊ณ ๋๋ก ์ต์ ํ | Python ์ค๋ฒํค๋ ์กด์ฌ |
| ์คํธ๋ฆฌ๋ฐ | ๋ด์ฅ ์ง์ (stream=True) | ๋ณต์กํ ๊ตฌํ ํ์ |
| ์์ํ | ๊ธฐ๋ณธ ์ง์ (Q8_0, Q4_0 ๋ฑ) | ๋ณ๋ ๋ผ์ด๋ธ๋ฌ๋ฆฌ ํ์ |
| ์ปค์คํฐ๋ง์ด์ง | API ํ๋ผ๋ฏธํฐ๋ก ์ ํ | ๋ชจ๋ ๋ด๋ถ ๋ก์ง ์ ๊ทผ ๊ฐ๋ฅ |
| ๋๋ฒ๊น | ์๋ฒ ๋ก๊ทธ๋ง ํ์ธ ๊ฐ๋ฅ | Python ์ฝ๋ ์ง์ ๋๋ฒ๊น |
| ์์กด์ฑ | requests ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ง | torch, transformers ๋ฑ |
| ๋์คํฌ ์ฌ์ฉ๋ | ์์ถ๋ ๋ชจ๋ธ (1.3GB) | ์๋ณธ ๋ชจ๋ธ (๋ ํฐ ์ฉ๋) |
| GPU ์ง์ | ์๋ ๊ฐ์ง ๋ฐ ์ต์ ํ | ์๋ ์ค์ ํ์ |
| CPU ์ต์ ํ | llama.cpp ๊ธฐ๋ฐ ์ต์ ํ | ๊ธฐ๋ณธ PyTorch CPU ์คํ |
Ollama ์ถ๋ก ์์
Ollama์ ๊ธฐ๋ณธ ์๋ฒ ํฌํธ๋ 11434์ด๋ค.
๐๏ธ ๋ชจ๋ธ ํ์ผ (๋์คํฌ): ๋ฐ์ดํฐ๋ง ์ ์ฅ
↓
๐ฅ๏ธ Ollama ์๋ฒ: ํ์ผ์ ์ฝ์ด์ ์ถ๋ก ์์ง ๊ตฌ๋
↓
๐ HTTP API: ์ธ๋ถ์์ ์ ๊ทผ ๊ฐ๋ฅํ ์ธํฐํ์ด์ค ์ ๊ณต
↓
๐ ollama.py: API๋ฅผ ํธ์ถํ๋ ํด๋ผ์ด์ธํธ'DeepLearning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
| [SLM] smollm ๋๋ ค๋ณด๊ธฐ with copilot (1) | 2025.08.11 |
|---|---|
| [aws ec2] vscode ์ฐ๊ฒฐ: config ์ค์ , ์ธ์คํด์ค ์ฉ๋ ์ฆ์ค (1) | 2025.08.11 |
| Class Imbalance (0) | 2022.12.26 |
| Diffusion Model - ๊ฐ๋ ์๊ธฐ (0) | 2022.10.11 |
| [๋ ผ๋ฌธ๋ฆฌ๋ทฐ] CutPaste: Self-Supervised Learning for Anomaly Detection and Localization (0) | 2022.08.04 |