TEN AI 공식블로그

본문 바로가기

전체 글

Tech & Product | 2026. 1. 23. ➂ ‘창고에서 공장으로’ : 엔비디아가 재 정의하는 ‘지능의 경제학’ - 세 번째 이야기 본 글은 NVIDIA GTC 2026을 앞두고 엔비디아의 핵심 전략인 'Extreme Co-Design'을 분석하는 5부작 시리즈의 세 번째 글입니다. 1편의 '딥시크 쇼크', 2편의 '하드웨어의 재정의'에 이어, 이번 편에서는 엔비디아가 구축한 'AI 팩토리'의 실체와 이것이 바꾸어 놓을 지능(Intelligence)의 경제학을 다룹니다.지난 2편에서 우리는 젠슨 황이 왜 칩(Chip) 단위를 버리고 랙(Rack) 단위의 설계를 선택했는지, 그리고 그 기술적 배경인'시스템 해체(Disaggregation)와 '초당 130TB의 연결(Interconnect)'에 대해 살펴보았습니다.이제 시선을 기술(Engineering)에서 시장(Market)으로 돌려볼 차례입니다. 엔비디아가 이..

카테고리 없음 | 2026. 1. 12. ② 젠슨 황의 선언, '무어의 법칙은 끝났다'와 Extreme Co-Design의 정의" - 두 번째 이야기본 글은 NVIDIA GTC 2026을 앞두고 엔비디아의 핵심 전략인 'Extreme Co-Design'을 분석하는 5부작 시리즈의 두 번째 글입니다.1편에서는 딥시크(DeepSeek)가 '주어진 하드웨어'를 극한으로 튜닝한 사례를 다뤘다면, 이번 편에서는 엔비디아가 하드웨어의 물리적 정의를 어떻게 바꾸고 있는지 파헤칩니다.지난 1편에서 우리는 딥시크가 H800이라는 제약된 하드웨어 위에서 소프트웨어를 극한으로 비틀어 짜내는 (Squeeze) 과정을 목격했습니다. 그것은 분명 위대한 엔지니어링 승리였지만, 동시에 젠슨 황이 지난 수년간 경고해 온 "범용 컴퓨팅 스케일링의 한계"를 역설적으로 증명하는 사례이기도 했습니다.젠슨 황은 여러 키노트와 인터뷰에서 "무어의 법칙은 사실상 끝났다..

Tech & Product | 2026. 1. 8. ① '결핍'이 쏘아 올린 Extreme Co-Design의 서막 - 첫 번째 이야기본 글은 다가오는 NVIDIA GTC 2026의 핵심 의제인 'Extreme Co-Design'을 깊이 있게 이해하기 위해 기획된 5 편 시리즈의 첫 번째 글로, 2025년 AI 인프라의 패러다임을 바꾼 'DeepSeek' 사태를 엔지니어링 관점에서 분석했습니다.2026년 3월, 전 세계 엔지니어들의 시선이 다시 한번 젠슨 황의 키노트로 향하고 있습니다. 이번 NVIDIA GTC 2026에서 엔비디아가 보여줄 '루빈(Rubin)' 플랫폼과 AI 팩토리 비전을 제대로 이해하기 위해서는, 시계를 잠시 1년 전으로 되돌려 2025년 1월을 강타했던 'DeepSeek(딥시크) 사태'를 복기할 필요가 있습니다.당시 중국의 DeepSeek는 미국의 제재로 대역폭이 토막 난 H800 칩셋을 사용하..

Tech & Product | 2025. 12. 11. AI Pub Ops 4.0.0 공개 : "기반"을 넘어 "본질"이 되다 최근 ‘AI 버블’이라는 표현이 종종 언급됩니다.AI에 대한 대규모 투자 이후, 투자 대비 성과에 대한 고민이 커지고 있기 때문입니다.이 과정에서 기업들은 AI 인프라 효율화를 중요한 과제로 인식하기 시작했습니다.TEN은 기업들의 실제 운영 환경에서 축적된 요구를 반영해 한층 강화된AI 인프라 운영 플랫폼 AI Pub Ops 4.0.0을 공개했습니다.🌟 AI Pub Ops 4.0.0 Kubernetes-native 아키텍처로 진화한 AI 인프라 운영 🌟 AI Pub Ops 4.0.0은 Kubernetes의 핵심 설계 철학을 깊이 반영한 Kubernetes-native 아키텍처를 기반으로 설계되었습니다.이를 통해 AI 인프라 운영의 안정성, 확장성, 그리고 운영 일관성을 한층 강화했습니다.엔터프라이즈..

TEN Story/TEN의 움직임 | 2025. 10. 21. 텐(TEN Inc.), 엔비디아 파트너 네트워크(NPN) 공식 합류! AI 인프라 혁신 가속화 선언 ㈜텐(TEN Inc.)이 엔비디아 파트너 네트워크(NVIDIA Partner Network, NPN)에 Solution Advisor Consultant로 공식 합류했다는 기쁜 소식을 전합니다. 이번 합류는 TEN의 AI 인프라 기술력과 전문성이 글로벌 시장에서 공식적으로 인정받고, 새로운 도약을 위한 결정적인 발판을 마련했다는 의미가 있으며, 기업 고객에게 최적화된 AI 환경을 제공하는 데 더욱 박차를 가할 수 있게 됐습니다. [NPN 합류의 의미와 고객 가치]TEN은 이번 NPN 합류를 통해 엔비디아의 최신 GPU 및 선도적인 소프트웨어 생태계를 자사 솔루션과 기술력에 긴밀하게 결합할 수 있게 되었습니다. 이를 통해 기업 고객들은 다음과 같은 핵심 가치를 확보할 수 있습니다. ▷ 안정적이고 검증된 아..

Tech & Product/AI, 더 쉽게 | 2025. 8. 13. AI 인프라를 읽고, 판단하고, 대응하는 모니터링 시스템 🖥️AI 인프라 운영은일반 서버 인프라 관리보다 훨씬 까다롭습니다. 모델 학습과 추론이 동시에 진행되기도 하고,GPU·CPU·스토리지·네트워크 자원이 여러 사용자와 서비스에 실시간으로 공유되기 때문입니다.문제는, 이렇게 복잡하게 얽힌 환경에서 단순 수치 모니터링만으로는상황을 정확히 파악하기 어렵다는 것입니다.GPU 사용률이 80%라고 해서 성능이 잘 나오고 있다고 단정할 수 없고, 반대로 사용률이 낮다고 해서 여유 있다고 보장할 수도 없습니다.예를 들어,• 특정 모델이 GPU 메모리를 과도하게 점유해 다른 작업에 영향을 주는 경우• 네트워크 병목으로 학습 속도가 급격히 떨어지는 경우• 일부 노드만 비정상적으로 과부하가 걸리는 경우• 이 모든 문제는 실시간 상태를 다각도로 모니터링하지 않으면 놓치기 ..

카테고리 없음 | 2025. 7. 29. AI Pub Dev를 사용하면 AI 개발 환경, 이렇게 달라집니다 AI Pub Dev로 AI 개발 환경, 이렇게 달라집니다AI 개발 환경을 구축하고 운영해본 경험이 있는 분이라면누구나 이런 고민을 해보셨을 겁니다. •학습 환경을 매번 다시 세팅하는 비효율•워크로드가 꼬이면 원인 찾느라 하루가 간다•협업은 늘 귀찮고, 권한 관리는 더 복잡하다 이런 문제는 GPU 인프라가 AI 개발에 최적화되어 있지 않아서 생기는 일입니다.AI Pub Dev는바로 이 지점을 해결합니다. ✅ AI Pub Dev란? AI Pub Dev는 AI 개발·학습에 최적화된 MLOps 도구입니다.복잡한 환경 설정 없이, 쉽고 빠르게 개발에 집중할 수 있도록 만들어졌습니다. 핵심 가치GPU 자원의 효율적 관리 + 개발자 편의성 + 반복 가능한 AI 실험 환경 🔍 어떻게 바뀌나요? 1️⃣ 개발 환..

카테고리 없음 | 2025. 7. 22. AI 서버 장애, 왜 자꾸 반복될까? AI Helper가 알려드립니다. 갑자기 서비스가 느려졌다면?AI 인프라 운영 중 이런 경험, 한 번쯤 해보셨을 겁니다. 실이 엉켜 어디가 문제인지 모를 때👉 AI Helper가 명확하게 풀어드립니다. • 서비스가 느려졌다?• 대체 어디서부터 봐야 하지?• Kubernetes? Pod? PVC? 로그? 어디가 문제지? 이렇게 어디서부터 손대야 할지 모를 때, AI Helper는 빠르게 움직입니다. 장애는 언제나 예고 없이 찾아옵니다.복잡한 인프라일수록, 문제를 찾는 시간이 더 오래 걸립니다.Kubernetes 기반의 AI 인프라는 특히 더 복잡하죠.• 수많은 Node와 Pod• 엉켜버린 PVC• 쌓이고 쌓인 로그이 모든 걸 하나하나 살피는 건 현실적으로 불가능에 가깝습니다. AI Helper는 다릅니다.장애 발생 전, 이상 ..

Tech & Product/AI, 더 쉽게 | 2025. 7. 14. 하이브리드 & 멀티클러스터 AI 인프라, 한 번에 관리하려면? 흩어진 AI 인프라, 한 곳에서 통합 운영하는 방법AI 워크로드가 늘어날수록, 운영 환경은 복잡해지고 있습니다.온프렘/클라우드가 섞이고, 클러스터는 전 세계로 퍼져나가고,프로젝트마다 리소스 사용 기준이 다를 때,우리는 운영 통제권을 점점 잃고 있습니다. 🔍 AI 인프라, 왜 이렇게 복잡해졌을까?과거에는 GPU 서버 한두 대만 있으면 충분했습니다.하지만 지금은 다릅니다.✔ AI 학습은 온프렘, 추론은 클라우드✔ 서울의 온프렘 클러스터와 미국의 클라우드 리전을 함께 사용하는 구조✔ 프로젝트별로 스토리지, 네트워크, 보안정책까지 제각각※ 참고 • 온프렘(서울 IDC): 기업이 자체 보유하거나 임대한 사내 데이터센터 인프라• 클라우드 리전: AWS, GCP, Azure 등 글로벌 클라우드 사업자가 운영하는 지..

이전 1 2 3 4 ··· 14 다음

티스토리툴바