"성능 4배 개선된 NPU IP 출시...온디바이스AI에 최적화"
-
기사 스크랩
-
공유
-
댓글
-
클린뷰
-
프린트
오픈엣지, '트랜스포머' 기반 고성능 NPU IP ‘ENLIGHT Pro’ 공개
인공지능NPU IP 포트폴리오 확장을 위한 새로운 IP 신제품
인공지능NPU IP 포트폴리오 확장을 위한 새로운 IP 신제품
반도체 설계자산(IP) 플랫폼 전문회사 오픈엣지테크놀로지(이하 오픈엣지)가 기존 제품 대비 최소 4배 개선된 성능을 자랑하는 고성능 신경망처리장치(NPU), 'ENLIGHT PRO (인라이트 프로)'를 출시했다고 17일 밝혔다.
업계 최초로 개발된 엣지 환경을 목표로 하는 4·8비트 혼합정밀도 NPU IP ‘인라이트(ENLIGHT)’의 후속 버전으로, 이전 버전보다 성능을 최소 4배 이상 향상시켰고 새로운 신경망에 대응할 수 있는 확장성과 유연성을 대폭 강화했다. 특히 성능과 유연성이 동시에 요구되는 완전 자율주행, 카메라, 모바일 기기 등의 온디바이스 AI 제품에 가장 적합한 게 특징이다.
자율주행 기술은 운전자의 조작 없이 스스로 주행하는 차량의 능력으로, 레벨 0부터 레벨 5까지 총 6단계로 분류된다. 현재 가장 널리 사용되고 있는 레벨 2의 운전자 주행을 보조하는 ADAS(Advanced Driver Assistance System)가 대표적이다. 최근에는 특정 조건 하에서 작동하는 레벨 3 자율주행 기술이 탑재된 차량도 출시되었지만, 대부분의 자율주행 기술은 여전히 레벨 2에 머무르고 있다.
레벨 3 이상의 자율주행을 위해서는 칩당 최소 100 TOPS (Terra Operations per Second) 에서 1000 TOPS이상의 데이터 처리 속도를 제공할 수 있는 고성능 NPU가 필요하다. 그러나 높은 성능과 함께 소비 전력 효율성이 높고, 저전력 설계가 요구되는 자율주행 기술 개발은 여전히 개발 난도가 높아, 자율주행 개발은 더디게 진행 중이다.
오픈엣지의 엣지용 ‘인라이트 프로’는 에너지 제약이 큰 환경에서도 대규모 언어모델 (LLM: Large Language Model)의 핵심 구성 요소인 ‘트렌스포머’ 를 지원하는 신경망 가속기로 개발됐다.
기존 ‘인라이트’에 비해 ▲MAC (Multiply-Accumulate) 연산 성능 4배 이상 향상, ▲ 벡터 프로세서(Vector Processor) 성능 64배 개선, ▲ 부동소수점(floating-point) 처리 기능 지원 범위 확장 등을 통해 메모리-연산 간의 빠른 상호작용이 가능해졌다.
‘인라이트 프로’는 최소 8 TOPS에서 수백 TOPS의 성능까지 확대 가능하다. 또한 오픈소스 아키텍쳐인 RISC-V 를 사용하여 반도체 설계를 위한 비용을 최소화하고 하드웨어 리소스를 적게 사용하면서도 유연성과 확장성을 강화해 다양한 신경망을 지원할 수 있도록 했다. 또한, 오픈엣지는 ‘인라이트 프로’와 함께 컴파일러와 양자화 개발환경을 포함하는 ‘소프트웨어 개발 키트, (SDK, Software Development Kit)’를 제공해, 사용자 편의성을 극대화했다.
NPU의 고성능화가 진행됨에 따라, 대용량 데이터를 신속하게 처리할 수 있는 메모리 시스템 개발의 중요성이 점점 더 커지고 있다. 특히 엣지 디바이스에서의 LLM 구동은 프로세싱이 아닌 메모리 대역폭에서 성능이 제한되는 현상을 보여주고 있다. 이러한 상황에서 오픈엣지의 NPU IP 와 메모리 시스템 IP 는 상호 유기적으로 통합되어 최적화된 형태로 반도체 설계업체에게 제공되고 있다. 이렇게 NPU 와 메모리 시스템을 최적화시킨 AI 반도체 플랫폼을 제공하는 것은 전세계적으로 유일하게 오픈엣지만이 제공가능하다는 게 회사 측 설명이다.
이성현 오픈엣지 대표는 "하반기에 자동차 기능 안전에 대한 국제 표준인 ISO26262 인증을 획득할 예정이며, 이를 바탕으로 검증된 자율주행용 IP를 활용해 글로벌 고객사와의 라이선스 계약 체결을 확대할 것"이라고 말했다. 또 "적극적인 R&D 연구개발을 통해 레벨 3이상의 고성능 자율주행 반도체 칩에 적용될 수 있도록 노력하겠다"고 덧붙였다.
한편, 오픈엣지는 지난 1월 국제표준 품질경영시스템 SO9001:2015 인증을 취득한 바 있다.
유주안기자 jayou@wowtv.co.kr
업계 최초로 개발된 엣지 환경을 목표로 하는 4·8비트 혼합정밀도 NPU IP ‘인라이트(ENLIGHT)’의 후속 버전으로, 이전 버전보다 성능을 최소 4배 이상 향상시켰고 새로운 신경망에 대응할 수 있는 확장성과 유연성을 대폭 강화했다. 특히 성능과 유연성이 동시에 요구되는 완전 자율주행, 카메라, 모바일 기기 등의 온디바이스 AI 제품에 가장 적합한 게 특징이다.
자율주행 기술은 운전자의 조작 없이 스스로 주행하는 차량의 능력으로, 레벨 0부터 레벨 5까지 총 6단계로 분류된다. 현재 가장 널리 사용되고 있는 레벨 2의 운전자 주행을 보조하는 ADAS(Advanced Driver Assistance System)가 대표적이다. 최근에는 특정 조건 하에서 작동하는 레벨 3 자율주행 기술이 탑재된 차량도 출시되었지만, 대부분의 자율주행 기술은 여전히 레벨 2에 머무르고 있다.
레벨 3 이상의 자율주행을 위해서는 칩당 최소 100 TOPS (Terra Operations per Second) 에서 1000 TOPS이상의 데이터 처리 속도를 제공할 수 있는 고성능 NPU가 필요하다. 그러나 높은 성능과 함께 소비 전력 효율성이 높고, 저전력 설계가 요구되는 자율주행 기술 개발은 여전히 개발 난도가 높아, 자율주행 개발은 더디게 진행 중이다.
오픈엣지의 엣지용 ‘인라이트 프로’는 에너지 제약이 큰 환경에서도 대규모 언어모델 (LLM: Large Language Model)의 핵심 구성 요소인 ‘트렌스포머’ 를 지원하는 신경망 가속기로 개발됐다.
기존 ‘인라이트’에 비해 ▲MAC (Multiply-Accumulate) 연산 성능 4배 이상 향상, ▲ 벡터 프로세서(Vector Processor) 성능 64배 개선, ▲ 부동소수점(floating-point) 처리 기능 지원 범위 확장 등을 통해 메모리-연산 간의 빠른 상호작용이 가능해졌다.
‘인라이트 프로’는 최소 8 TOPS에서 수백 TOPS의 성능까지 확대 가능하다. 또한 오픈소스 아키텍쳐인 RISC-V 를 사용하여 반도체 설계를 위한 비용을 최소화하고 하드웨어 리소스를 적게 사용하면서도 유연성과 확장성을 강화해 다양한 신경망을 지원할 수 있도록 했다. 또한, 오픈엣지는 ‘인라이트 프로’와 함께 컴파일러와 양자화 개발환경을 포함하는 ‘소프트웨어 개발 키트, (SDK, Software Development Kit)’를 제공해, 사용자 편의성을 극대화했다.
NPU의 고성능화가 진행됨에 따라, 대용량 데이터를 신속하게 처리할 수 있는 메모리 시스템 개발의 중요성이 점점 더 커지고 있다. 특히 엣지 디바이스에서의 LLM 구동은 프로세싱이 아닌 메모리 대역폭에서 성능이 제한되는 현상을 보여주고 있다. 이러한 상황에서 오픈엣지의 NPU IP 와 메모리 시스템 IP 는 상호 유기적으로 통합되어 최적화된 형태로 반도체 설계업체에게 제공되고 있다. 이렇게 NPU 와 메모리 시스템을 최적화시킨 AI 반도체 플랫폼을 제공하는 것은 전세계적으로 유일하게 오픈엣지만이 제공가능하다는 게 회사 측 설명이다.
이성현 오픈엣지 대표는 "하반기에 자동차 기능 안전에 대한 국제 표준인 ISO26262 인증을 획득할 예정이며, 이를 바탕으로 검증된 자율주행용 IP를 활용해 글로벌 고객사와의 라이선스 계약 체결을 확대할 것"이라고 말했다. 또 "적극적인 R&D 연구개발을 통해 레벨 3이상의 고성능 자율주행 반도체 칩에 적용될 수 있도록 노력하겠다"고 덧붙였다.
한편, 오픈엣지는 지난 1월 국제표준 품질경영시스템 SO9001:2015 인증을 취득한 바 있다.
유주안기자 jayou@wowtv.co.kr