지난 두달 간, 인턴(연구연수생)을 하면서 인상 깊었던 디바이스에 대해 소개 및 관련 자료를 정리하려고한다.
나는 실무에서 프로젝트의 업무를 하기 위해 Jetson nano를 대여할 수 있었고 완수하였다.
Jetson Nano 란 무엇인가?
NVIDIA에서 개발한 소형 컴퓨터 모듈이다.
저전력 시스템에서 고성능 연산을 수행할 수 있도록 설계 되었고, AI & 머신러닝에 적합한 디바이스이다.
Jetson Nano 의 사양은?
- CPU: 64비트 Quad-Core ARM A57
- GPU: 128-core NVIDIA Maxwell architecture-based GPU
- 메모리: 4GB LPDDR4
- 스토리지: microSD 카드 슬롯
- 비디오 인코딩/디코딩 기능: 4K @ 30 | 4x 1080p @30 |9x720p @30 (H.264/H.265)
- I/O 포트
- HDMI 1개, DP 1개, USB 3.0 4개, 기가비트 이더넷 1개
- GPIO, I2C, I2S, SPI, UART
- M.2 Key E 슬롯 1개
- MIPI-CSI 카메라 커넥터 1개
- 4핀 Fan 커넥터 1개, PoE 커넥터 1개 - 전원
- DC 잭 : 최대 입력 5V@4A
- micro USB 포트 : 최대 입력 5V@2A
이며 특히 고속 연산에 사용되는 CUDA-Core 가 128개 있기 때문에 성능은 충분하다.
손바닥 만한 디바이스가 4k 영상출력도 시원시원하게 된다.
GPU 성능과 관련된 상세한 내용
- GPU 이름/종류 : GM20B/TM660M-A2
- 아키텍쳐 : Maxwell 2.0
- 생산자(Foundry)/집적 밀도 : TSMC/20nm
- 트랜지스터 수 : 20억개 (2,000 million)
- 다이 크기 : 118mm^2
- GPU 클럭 : 640Mhz(베이스) / 921Mhz(부스트)
- TDP : 10W
- 쉐이더 유닛 수 : 128개
- TMUs/ROPs : 16/16
- DirectX : 12 (12_1)
- 픽셀 레이트/텍스쳐 레이트 : 14.74GPixel/s
- FP16/FP32/FP64 : 471.6GFLOPS / 235.8GFLOPS / 7.368GFLOPS
출처 : www.techpowerup.com/gpu-specs/jetson-nano-gpu.c3643
Jetpack을 통해 초기 셋팅이 가능하며
기본적으로 OpenCV , TensorRT , Ubuntu 18.04 버전이 설치 된다.
또한 GPLO 40핀 단자가 있기 때문에 (카메라 모듈 및 센서 탑재) 유연한 확장이 가능하다. (전력이 달라지면 성능이 달라지니 유의하자)
가장 큰 장점은 딥러닝 추론 라이브러리인 TensorRT가 탑재된것이다.
(아래는 TensorRT에 대한 정리 블로그)
https://boramchan-corgi.tistory.com/22
다음 블로그는 Jetson nano Yolo 사용을 위한 포팅에 대한 글을 정리해볼까한다.
초소형 엣지 디바이스 즉 임베디드 시스템에 대해 큰 관심이 있다면 꼭 사용해보는것이 좋을 것 같다.
개인적인 의견으로는 자연어 모델, 분산학습처리에 있어서,
좋은 그래픽 카드를 사용하면 더할나위 없이 이상적이겠지만 jetson nano 여러 대와, 확실한 네트워킹이 있다면 효율적인 가격으로 이룰수 있지 않을까라는 생각을 하게 되었다.
참고자료
https://developer.nvidia.com/embedded/jetson-nano-developer-kit
'ML & AI & DL 맛보며 친해지기' 카테고리의 다른 글
NVIDIA Tensor RT 에 대해 알아보기 (0) | 2023.08.28 |
---|---|
[Deep Learning] ONNX 란? (0) | 2023.07.26 |