개발

  • 홈
  • 태그
  • 방명록

GPU 1

vLLM 설치 w/AKS

PC가 아닌 Kuernetes에 Container 형태로 vLLM을 설치 및 서비스해보자. 마침 VM size(NC40ads H100 v5) 40vcpus, 320 GiB memory의 Node pool이 존재하여 해당 자원을 활용하기로 한다. 설치하기설치된 AKS에서 진행하는데 기존에 Ollama로 LLM을 간단하게 서비스하고 있었던 점을 참고하자. [참고] vllm docshttps://docs.vllm.ai/projects/production-stack/en/vllm-stack-0.1.5/deployment/cloud-deployment/azure.html 우선 GitHub Repository를 clone하여 helm chart를 확인하자.mango@mac llm % git clone https..

Engineering/AI 2026.01.05
이전
1
다음
더보기
프로필사진

  • 분류 전체보기 (30)
    • Software (4)
      • Spring Cloud (4)
    • Engineering (26)
      • AI (5)
      • DevOps (11)
      • k8s (7)
      • minikube (1)

Tag

Jenkins, Cilium, npm, spring-cloud, minikube, ollama, EC2, Helm, docker, CICD, AKS, MacOS, Nexus, kubeadm, Kubernetes, gitea, private, gradle, vllm, AWS,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2026/04   »
일 월 화 수 목 금 토
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30

방문자수Total

  • Today :
  • Yesterday :

Copyright © AXZ Corp All rights reserved.

티스토리툴바