콘텐츠로 건너뛰기
  • 카테고리
  • 최근
  • 태그
  • 인기
  • 사용자
  • 그룹
스킨
  • Light
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 기본 (Cosmo)
  • 스킨 없음
축소

책공장

Powered by Argo9 | a1bbs | 한 권의 책
  1. 홈
  2. 카테고리
  3. AI와 함께
  4. ollama cloud 를 사용하면 더 큰 모델을 무료로 사용가능
AI시대 출판사, 창작자는 무엇을 해야할지

0

온라인

133

사용자

22.0k

토픽

22.2k

게시물

ollama cloud 를 사용하면 더 큰 모델을 무료로 사용가능

예약됨 고정됨 잠김 이동됨 AI와 함께
1 게시물 1 작성자 4 조회수
  • 오래된 순
  • 최신 순
  • 가장 많은 투표
답글
  • 토픽으로 답글
로그인 후 답글 작성
이 토픽은 삭제되었습니다. 토픽 관리 권한이 있는 사용자만 볼 수 있습니다.
  • adminA 오프라인
    adminA 오프라인
    admin
    에 작성함 마지막 수정자:
    #1

    ollama cloud 를 사용하면 더 큰 모델을 무료로 사용가능

    개인용 → CPU만 있어도 충분히 사용할 수 있지만 GPU가 있다면 5‑10배 빠른 응답을 얻을 수 있습니다.
    월 30 K 토큰 이하면 Free 플랜만으로도 충분하고, 비용을 걱정할 필요가 없습니다.

    시나리오 모델(예) 하드웨어 추정 월 비용 추정 응답 시간
    내 PC (CPU 8코어, 16 GB RAM) llama3.2 (CPU‑only) Intel i7‑9700K $0 (전기·하드웨어 제외) 2‑5 초 / 1 K 토큰
    내 PC (GPU RTX 3080) llama3.2 (GPU) RTX 3080 10 GB VRAM $0 0.3‑0.8 초 / 1 K 토큰
    Ollama Cloud Pro llama3.2 (cloud GPU) Ollama 전용 $20‑$30 (1 M 토큰) 0.4‑1.2 초 / 1 K 토큰
    Ollama Cloud Enterprise 전용 모델 / 높은 RPS 전용 GPU 계약 기반 0.2‑0.5 초 / 1 K 토큰

    항목 내용
    월 토큰 한도 30 K 토큰 (≈ 30 000 단어)
    요청 속도 1 RPS (초당 1회) – 개인용이면 크게 문제되지 않음
    가격 무료
    제공 모델 llama3.2, phi-3, gemma2 등 최신 모델 (버전 업데이트 자동)
    대시보드 토큰 사용량, 요청 로그를 Ollama Cloud 콘솔에서 실시간 확인 가능
    하루 2 회 정도이면:
    예시 – 평균 300 토큰(짧은 질의·응답) × 2 회 = 600 토큰/일 → ≈ 18 K 토큰/월 → 무료 한도 내에 충분합니다.

    이제 워크샵용 서비스를 제공해드릴 수 있겠네요.

    1 답글 마지막 답글
    0
    답글
    • 토픽으로 답글
    로그인 후 답글 작성
    • 오래된 순
    • 최신 순
    • 가장 많은 투표


    Powered by Argo9 | a1bbs |bombomschool | Contributors
    • 로그인

    • 계정이 없으신가요? 등록

    • 검색하려면 로그인하거나 등록하세요.
    • 첫 게시물
      마지막 게시물
    0
    • 카테고리
    • 최근
    • 태그
    • 인기
    • 사용자
    • 그룹