보람찬 코기의 개발자 블로그
article thumbnail
반응형

지난 두달 간, 인턴(연구연수생)을 하면서 인상 깊었던 디바이스에 대해 소개 및 관련 자료를 정리하려고한다.

 

나는 실무에서 프로젝트의 업무를 하기 위해 Jetson nano를 대여할 수 있었고 완수하였다.


Jetson Nano 란 무엇인가?

https://www.nvidia.com/en-us/autonomous-machines/embedded-systems/jetson-nano/

 

NVIDIA에서 개발한 소형 컴퓨터 모듈이다.

 

저전력 시스템에서 고성능 연산을 수행할 수 있도록 설계 되었고, AI & 머신러닝에 적합한 디바이스이다. 

 


Jetson Nano 의 사양은?

  • CPU: 64비트 Quad-Core ARM A57
  • GPU: 128-core NVIDIA Maxwell architecture-based GPU
  • 메모리: 4GB LPDDR4
  • 스토리지: microSD 카드 슬롯
  • 비디오 인코딩/디코딩 기능: 4K @ 30 | 4x 1080p @30 |9x720p @30 (H.264/H.265)
  • I/O 포트
    - HDMI 1개, DP 1개, USB 3.0 4개, 기가비트 이더넷 1개
    - GPIO, I2C, I2S, SPI, UART
    - M.2 Key E 슬롯 1개
    - MIPI-CSI 카메라 커넥터 1개
    - 4핀 Fan 커넥터 1개, PoE 커넥터 1개
  • 전원
    - DC 잭 : 최대 입력 5V@4A
    - micro USB 포트 : 최대 입력 5V@2A

이며 특히 고속 연산에 사용되는 CUDA-Core 가 128개 있기 때문에 성능은 충분하다.

 

손바닥 만한 디바이스가 4k 영상출력도 시원시원하게 된다.

 

GPU 성능과 관련된 상세한 내용

  • GPU 이름/종류 : GM20B/TM660M-A2
  • 아키텍쳐 : Maxwell 2.0
  • 생산자(Foundry)/집적 밀도 : TSMC/20nm
  • 트랜지스터 수 : 20억개 (2,000 million)
  • 다이 크기 : 118mm^2
  • GPU 클럭 : 640Mhz(베이스) / 921Mhz(부스트)
  • TDP : 10W
  • 쉐이더 유닛 수 : 128개
  • TMUs/ROPs : 16/16
  • DirectX : 12 (12_1)
  • 픽셀 레이트/텍스쳐 레이트 : 14.74GPixel/s
  • FP16/FP32/FP64 : 471.6GFLOPS / 235.8GFLOPS / 7.368GFLOPS

출처 : www.techpowerup.com/gpu-specs/jetson-nano-gpu.c3643

 

NVIDIA Jetson Nano Specs

NVIDIA GM20B, 921 MHz, 128 Cores, 16 TMUs, 16 ROPs, 4096 MB LPDDR4, 1600 MHz, 64 bit

www.techpowerup.com


Jetpack을 통해 초기 셋팅이 가능하며 

 

기본적으로 OpenCV , TensorRT , Ubuntu 18.04 버전이 설치 된다.

 

또한 GPLO 40핀 단자가 있기 때문에 (카메라 모듈 및 센서 탑재) 유연한 확장이 가능하다. (전력이 달라지면 성능이 달라지니 유의하자)

 

가장 큰 장점은 딥러닝 추론 라이브러리인 TensorRT가 탑재된것이다.

(아래는 TensorRT에 대한 정리 블로그)

 

https://boramchan-corgi.tistory.com/22

 

NVIDIA Tensor RT 에 대해 알아보기

Tensor RT란? NVIDIA 에서 제작했으며, 학습된 Deep Learning 모델을 최적화하여 NVIDIA GPU 상에서의 Inference 속도를 수배 ~ 수십배 까지 향상 시키는 모델 최적화 엔진이다. 가장 핵심포인트는 고성능 딥러

boramchan-corgi.tistory.com

 

다음 블로그는 Jetson nano  Yolo 사용을 위한 포팅에 대한 글을 정리해볼까한다.

 

초소형 엣지 디바이스 즉 임베디드 시스템에 대해 큰 관심이 있다면 꼭 사용해보는것이 좋을 것 같다.

 

 

개인적인 의견으로는 자연어 모델, 분산학습처리에 있어서,

 

좋은 그래픽 카드를 사용하면 더할나위 없이 이상적이겠지만 jetson nano 여러 대와, 확실한 네트워킹이 있다면 효율적인 가격으로 이룰수 있지 않을까라는 생각을 하게 되었다.

 

 

참고자료

https://developer.nvidia.com/embedded/jetson-nano-developer-kit

 

Jetson Nano Developer Kit

Run multiple neural networks in parallel for different applications.

developer.nvidia.com

 

반응형

'ML & AI & DL 맛보며 친해지기' 카테고리의 다른 글

NVIDIA Tensor RT 에 대해 알아보기  (0) 2023.08.28
[Deep Learning] ONNX 란?  (0) 2023.07.26
profile

보람찬 코기의 개발자 블로그

@BoChan

포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!