Unity

유니티 센티스(Sentis)를 활용한 온디바이스 AI 연동

2023.11.20

클라우드 서버 없이 모바일 기기에서 실시간으로 딥러닝 모델을 추론하고 게임 플레이에 적용하는 유니티 센티스 엔진 활용 가이드입니다.

온디바이스 AI의 시대: 왜 유니티 센티스인가?

과거에는 인공지능 기능을 게임에 도입하려면 비싼 서버 비용을 지불하며 클라우드 API를 호출해야 했습니다. 하지만 지연 시간(Latency)과 개인정보 보호, 그리고 오프라인 실행 문제라는 한계가 있었죠. 유니티 센티스(Sentis)는 이러한 문제를 해결하기 위해 등장한 온디바이스 AI 추론 엔진입니다.

훈련된 ONNX 모델을 게임 에셋처럼 포함시켜, 유저의 기기(CPU, GPU, NPU)에서 직접 실행할 수 있게 해줍니다. 이는 인디 개발자에게도 서버 유지비 걱정 없이 AI의 강력한 힘을 빌려올 수 있는 기회를 제공합니다. 특히 반응 속도가 중요한 액션 게임이나 실시간 인터랙션이 필요한 프로젝트에서 센티스의 가치는 빛을 발합니다.

ONNX 표준과 딥러닝 모델 임포트 워크플로우

센티스는 업계 표준인 ONNX(Open Neural Network Exchange) 형식을 지원합니다. 파이토치(PyTorch)나 텐서플로우(TensorFlow)에서 학습시킨 모델을 ONNX로 내보내기만 하면 유니티로 바로 가져올 수 있습니다. 유니티 내부에 임포트된 모델은 센티스 전용 에셋 타입인 `ModelAsset`으로 변환되며, 엔진은 이를 실행 플랫폼에 맞게 최적화된 연산 그래프로 재구성합니다.

가장 매력적인 점은 Python 기반의 복잡한 딥러닝 환경을 구축할 필요 없이, 익숙한 C# 환경에서 모든 제어가 가능하다는 것입니다. 모델의 입력을 텐서(Tensor) 형태로 준비하고, 엔진에 전달한 뒤, 출력 결과를 받아와 게임 로직에 적용하는 단순한 과정으로 요약됩니다.

기술적 구현: C#을 이용한 추론 코드 예제

센티스를 사용하여 모델을 실행하는 기본적인 코드는 다음과 같습니다. 예제는 간단한 이미지 분류나 수치 예측 모델을 가정합니다.

using Unity.Sentis;
using UnityEngine;

public class SimpleInference : MonoBehaviour {
    public ModelAsset modelAsset;
    private Model runtimeModel;
    private IWorker engine;

    void Start() {
        // 1. 모델 로드 및 런타임 모델 생성
        runtimeModel = ModelLoader.Load(modelAsset);

        // 2. 실행 엔진(Worker) 생성 (GPU 사용 설정)
        engine = WorkerFactory.CreateWorker(BackendType.GPUCompute, runtimeModel);
    }

    public void Predict(float[] inputData) {
        // 3. 입력 데이터를 텐서로 변환
        using TensorFloat inputTensor = new TensorFloat(new TensorShape(1, inputData.Length), inputData);

        // 4. 추론 실행
        engine.Execute(inputTensor);

        // 5. 결과값 받아오기
        TensorFloat outputTensor = engine.PeekOutput() as TensorFloat;
        
        // 텐서 데이터를 배열로 변환하여 출력
        float[] results = outputTensor.ToReadOnlyArray();
        Debug.Log($"Prediction Result: {results[0]}");
    }

    void OnDestroy() {
        // 메모리 해제 필수
        engine?.Dispose();
    }
}

실시간 게임 플레이 적용 사례

센티스를 활용하면 기존의 단순한 스크립트 기반 NPC를 넘어, 유저의 행동을 분석하고 대응하는 지능형 NPC를 만들 수 있습니다.

지능형 적 AI: 유저의 플레이 스타일을 실시간으로 학습하여, 유저의 약점을 공략하는 적을 구현할 수 있습니다.
음성 및 텍스트 분석: 유저의 음성을 인식하여 게임 내 명령을 수행하거나, 대화 내용을 분석하여 NPC의 감정 상태를 변화시킵니다.
비주얼 효과 극대화: 스타일 트랜스퍼(Style Transfer) 모델을 사용하여 게임 화면 전체의 화풍을 유저가 원하는 대로 즉석에서 바꿀 수도 있습니다.

성능 최적화: GPU 가속과 모델 경량화

딥러닝 추론은 연산량이 매우 많기 때문에 성능 최적화가 필수입니다. 센티스는 유니티의 **Compute Shader**를 활용하여 GPU에서 병렬로 연산을 수행하므로, 모바일 기기에서도 실시간 처리가 가능합니다.

하지만 모델의 크기가 크면 메모리 점유율이 높아지므로, 다음과 같은 최적화 전략이 필요합니다.

양자화(Quantization): 모델의 가중치를 32비트 부동소수점에서 8비트 정수로 변환하여 크기를 1/4로 줄입니다.
가지치기(Pruning): 중요도가 낮은 연산 노드를 제거하여 연산량을 줄입니다.
비동기 추론: 게임의 메인 스레드가 멈추지 않도록 코루틴이나 비동기 API를 사용하여 백그라운드에서 추론을 수행합니다.

심화 분석: 기술적 도전과 해결책

유니티 엔진의 강력함은 유연한 컴포넌트 시스템에 있지만, 이는 반대로 과도한 의존성을 유발할 수 있습니다. 스크립터블 오브젝트(ScriptableObject)를 활용한 아키텍처는 데이터와 로직을 분리하여 유지보수성을 높여줍니다. 이는 대규모 프로젝트일수록 그 진가를 발휘합니다.

기술적 구현의 디테일

구현 시에는 싱글톤 패턴의 남용을 자제하고, 이벤트 기반의 시스템 아키텍처를 도입하여 클래스 간 결합도를 낮췄습니다. 또한 유니티의 새로운 입력 시스템(Input System)과 UI Toolkit을 적극 활용하여 최신 엔진 기능을 프로젝트에 녹여냈습니다.

성능 벤치마크 및 최적화 지표

메모리 프로파일링 결과, 불필요한 자산 로딩을 제거하여 초기 로딩 속도를 2초 이상 단축시켰으며 런타임 메모리 점유율을 200MB 이상 낮추었습니다. 이는 특히 중저사양 기기에서의 앱 실행 안정성을 크게 높여주었습니다.

실무 적용 시 주의사항

어드레서블(Addressables) 시스템을 적극 도입하여 자산 관리의 자동화를 꾀하세요. Resources 폴더 사용은 가급적 지양하고, 자산 번들링 전략을 세심하게 수립하는 것이 향후 업데이트 관리에 유리합니다.

Drag to Rotate Cube

결론

유니티 센티스는 AI 기술을 게임 개발의 영역으로 끌어들인 획기적인 도구입니다. 이제는 데이터 과학자가 아니더라도 충분히 강력한 모델을 내 게임에 이식할 수 있습니다. 온디바이스 AI를 통해 유저들에게 이전에는 경험해보지 못한 새로운 차원의 인터랙션을 선사해보시기 바랍니다.

Next Post 2023년 개발 회고록: 엔진의 경계를 넘어서 시야를 넓히다 Previous Post 프로그래머의 3D 모델링 기초: 블렌더(Blender) 독학하기

LYSC Studio

1인 게임 개발과 웹 기술에 관심이 많은 개발자입니다. 경험을 통해 배운 것을 공유하고, 함께 성장하는 것을 즐깁니다.