TDA4的SDK环境搭建，SK开发板配置，TIDL demo运行，TIDL Tools与Edge AI Studio工具的介绍。

相关前置知识见上一篇：TDA4①：SDK, TIDL, OpenVX
下一篇：TDA4③：YOLOX的模型转换与SK板端运行

环境搭建需要下载SDK：PROCESSOR-SDK-J721E
以下两节是EVM板的PSDK RTOS与PSDK Linux的环境搭建，因为暂时没有EVM板所以没有上板测试，只有SK板可以跳到第三节 TDA4VM-SK 配置。

Linux SDK 环境搭建

#添加执行文件并执行
chmod +x ./ti-processor-sdk-linux-j7-evm-08_06_01_02-Linux-x86-Install.bin 
./ti-processor-sdk-linux-j7-evm-08_06_01_02-Linux-x86-Install.bin

#安装依赖的系统软件包和工具，安装过程中跳过需要连EVM的NFS、minicom、TFTP
#(若Ubuntu版本不匹配 > bin/setup-host-check.sh > if [ "$host" != "bionic" ] 改为 if [ "$host" != "focal" ] )
sudo ./setup.sh
#TISDK setup completed!

通过在根目录下make linux或u-boot等各种命令，可以快速的让SDK编译出你所需要的产物。注意需要手工修改Rules.mak文件中的DESTDIR变量为你的TF卡挂载路径。

#ti-processor-sdk-linux-j7-evm*/board-support/
Make linux        #编译Linux kernel代码和dtb，主要用于内核驱动的修改和裁剪。安装命令可以将内核和驱动模块自动拷贝到TF卡中。
Make linux_install  #生成built-images
Make u-boot       #编译u-boot代码，主要分为两部分：运行在MCU上的r5f部分和运行在A72上的a53部分。此处A72兼容A53指令集。
Make sysfw-image  #生成sysfw固件，主要在修改MSMC大小的时候会用到。

RTOS SDK 环境搭建

下载：
ti-processor-sdk-rtos-j721e-evm-08_06_01_03.tar.gz
ti-processor-sdk-rtos-j721e-evm-08_06_01_03-prebuilt.tar
+两个dataset.tar.gz

tar -xf ti-processor-sdk-rtos-j721e-evm-08_06_01_03.tar.gz  #解压
#配置RTOS和Linux的安装环境变量
export PSDKL_PATH=/home/wyj/SDK/ti-processor-sdk-linux-j7-evm-08_06_01_02
export PSDKR_PATH=/home/wyj/SDK/ti-processor-sdk-rtos-j721e-evm-08_06_01_03
#拷贝linux系统文件和linux启动文件到psdk rtos文件夹（或从rtos-prebuilt.tar）
cp ${PSDKL_PATH}/board-support/prebuilt-images/boot-j7-evm.tar.gz ${PSDKR_PATH}/
cp ${PSDKL_PATH}/filesystem/tisdk-default-image-j7-evm.tar.xz ${PSDKR_PATH}/
#安装依赖库和下载编译器，若安装报错则需换源，有包没安上会影响之后的make
./psdk_rtos/scripts/setup_psdk_rtos.sh  #若卡在git clone则进.sh把git://换成https://
#Packages installed successfully

Vision Apps Demo 编译

#修改文件 tiovx/build_flags.mak（没修改过则是默认）
BUILD_EMULATION_MODE=no #非模拟器模式
BUILD_TARGET_MODE=yes
BUILD_LINUX_A72=yes
PROFILE=release
#Optional:配置tiovx/build_flags.mak, vision_apps/vision_apps_build_flags.mak

#开始编译vision apps
cd vision_apps
make vision_apps -j8    #若缺少core-secdev-k3包，手动导入(https://git.ti.com/cgit/security-development-tools/core-secdev-k3/snapshot/core-secdev-k3-08.06.00.006.tar.gz)

#编译成功可以看到对应目录下有产出文件，RTOS SDK主要使用了一个开源编译框架concerto，这个框架基于Makefile，他能够自动搜索当前目录内的所有concerto.mak文件，并且分析依赖，一次将各个核心的固件全部编译出来。编译生成的文件位于
vision_apps/out/J7/A72/LINUX/$PROFILE
vision_apps/out/J7/R5F/SYSBIOS/$PROFILE
vision_apps/out/J7/C66/SYSBIOS/$PROFILE
vision_apps/out/J7/C71/SYSBIOS/$PROFILE
##If clean build of vision_apps/clean the full PSDK RTOS
#cd vision_apps, make vision_apps_scrub/make sdk_scrub

配置SD卡(EVM)

配置SD卡(EVM)，在TDA4VM的开发过程中，都是使用TF卡进行开发的。在单片机开发平台下，通常是直接用电脑使用USB方式将固件烧写到板卡的eMMC或FLASH中去。在TI平台下，首选的调试方法是使用TF卡：TF卡会被划分为两个分区，一个是 *BOOT* 分区（FAT32），用于存放bootloader如uboot等，另一个是 *rootfs* 分区（ext4），用于存放Linux需要的文件系统。每次Ubuntu编译完成的固件都需要手动拷贝到TF卡中，然后将TF卡插入EVM上电启动。

df -h, 查得SD卡设备名 /dev/sdb
使用RTOS SDK prebuilt中的脚本依次执行：

脚本	作用
sudo ./mk-linux-card.sh /dev/sdb	用途：将TF卡重新分区、并且格式化
./install_to_sd_card.sh	将该脚本旁边的文件系统压缩包直接拷贝到/media/USER/BOOT和/media/USER/rootfs中，需要十几分钟，之后该卡就可以启动了。
./install_data_set_to_sd_card.sh ./psdk_rtos_ti_data_set_08_06_00.tar.gz	以及./psdk_rtos_ti_data_set_08_06_00_j721e.tar.gz，将数据集解压到TF卡中对应的位置，这样默认SDK配套的Demo就可以正常运行。

添加可执行文件至SD card

1 2	cd ${PSDKR_PATH}/vision_apps make linux_fs_install_sd

然后即可插在EVM端运行，这里没有，跳过。

上面都是EVM板的相关环境配置，后面只拿到了SK板，因此转为SK板的相关配置。

TDA4VM-SK 配置

硬件信息：SK-TDA4VM 官网
 Processor SDK Linux for Edge AI Documentation
配置文档：Processor SDK Linux for SK-TDA4VM Documentation - getting_started，详细说明了如何配置，下面是简要步骤：

物料准备：
SK板，microUSB串口线，USB camera，HDMI/DP显示器，≥16GB的内存卡，网线和局域网*，串口电源（5-20V DC ≥20w），散热风扇

通过USB挂载SD卡到Ubuntu（在虚拟机设置里）
下载SD card .wic image，使用Balena etcher tool 1.7.0 把 image flash到SD卡上
然后插入SD卡到SK板，拨码开关拨到数字端，系统从SD卡启动
SK板连接显示器，上电，进入界面。
连接串口线，在虚拟机设置中挂载USB串口，使用 minicom 串口通讯：

sudo apt-get install minicom  #安装minicom(在minicom中自动换行：Ctrl+A Z W)
sudo minicom -D /dev/ttyUSB2 -c on
#输入用户名：root，登录tda4vm-sk
#若连接了USB摄像头此时会显示端口信息，也可以运行 ./init_script.sh 查摄像头端口号：/dev/video2

连接显示器后（HDMI/DP），可以鼠标点击试运行开箱即用的 GUI 应用程序，也可使用 Python 和C++参考示例开发边缘 AI 应用程序：

#配置
cd /opt/edgeai-gst-apps/configs/  #app_config_template.yaml中有参数介绍
vi image_classification.yaml  #flow参数配置为摄像头输入input0

#运行实例，替换为configs下其他文件能执行不同任务，如object_detection.yaml
#Classification (python)
cd /opt/edgeai-gst-apps/apps_python
./app_edgeai.py ../configs/image_classification.yaml  #ctrl+c退出
#Classification (c++)
cd /opt/edgeai-gst-apps/apps_cpp
./bin/Release/app_edgeai ../configs/image_classification.yaml
#视频流车辆检测
cd /opt/edgeai-gst-apps/scripts/optiflow
`./optiflow.py ../../configs/object_detection.yaml -t`  #如果没有单引号，终端会将 -t 选项解释为一个单独的参数，而不是作为 optiflow.py 命令的选项之一
#多flows
flows:
    # flowname : [input,mode1,output,[mosaic_pos_x,mosaic_pos_y,width,height]]
    flow0: [input0,model1,output0,[160,90,800,450]]
    flow1: [input0,model2,output0,[960,90,800,450]]
    flow2: [input1,model0,output0,[160,540,800,450]]
    flow3: [input1,model3,output0,[960,540,800,450]]

如果运行过程中突然重启，一般是需要加个风扇增强散热

可选操作：

连接网线，ifconfig查询板子ip地址，后面即可使用ssh登陆，可以使用vscode的remote插件来直接ssh登陆到板子，然后可以很方便地修改配置文件
安装tensorflow，onnx，python和c++依赖库 /opt/edge_ai_apps#./setup_script.sh

Dataflows

GStreamer input pipeline:

1
2
3

v4l2src device=/dev/video18 io-mode=2 ! image/jpeg, width=1280, height=720 ! jpegdec ! tiovxdlcolorconvert ! video/x-raw, format=NV12 ! tiovxmultiscaler name=split_01
split_01. ! queue ! video/x-raw, width=320, height=320 ! tiovxdlpreproc data-type=10 channel-order=1 mean-0=128.000000 mean-1=128.000000 mean-2=128.000000 scale-0=0.007812 scale-1=0.007812 scale-2=0.007812 tensor-format=rgb out-pool-size=4 ! application/x-tensor-tiovx ! appsink name=pre_0 max-buffers=2 drop=true
split_01. ! queue ! video/x-raw, width=1280, height=720 ! tiovxdlcolorconvert out-pool-size=4 ! video/x-raw, format=RGB ! appsink name=sen_0 max-buffers=2 drop=true

GStreamer output pipeline:

appsrc format=GST_FORMAT_TIME is-live=true block=true do-timestamp=true name=post_0 ! tiovxdlcolorconvert ! video/x-raw,format=NV12, width=1280, height=720 ! queue ! mosaic_0.sink_0
appsrc format=GST_FORMAT_TIME block=true num-buffers=1 name=background_0 ! tiovxdlcolorconvert ! video/x-raw,format=NV12, width=1920, height=1080 ! queue ! mosaic_0.background
tiovxmosaic name=mosaic_0
sink_0::startx="<320>"  sink_0::starty="<180>"  sink_0::widths="<1280>"   sink_0::heights="<720>"
! video/x-raw,format=NV12, width=1920, height=1080 ! kmssink sync=false driver-name=tidss

Edge AI application stack

TIDL

TIDL_Importer

RTOS SDK中内置TIDL_Importer，可以直接使用, 实现Demo模型转换和运行
Demo教程：MobileNetV2 Tensorflow，PeleeNet Caffe，JSegNet21V2 Caffe model，下面以PeleeNet为例

Config TIDL_Importer

export TIDL_INSTALL_PATH=/home/wyj/SDK/ti-processor-sdk-rtos-j721e-evm-08_06_01_03/tidl_j721e_08_06_00_10
#配置永久环境变量更方便，sudo gedit /etc/profile，末尾加入如上代码，然后source /etc/profile加载立即生效，但是后续有变动要记得改

#optional：tidlModelGraphviz tool 模型可视化工具
sudo apt install graphviz-dev
export TIDL_GRAPHVIZ_PATH=/usr
cd ${TIDL_INSTALL_PATH}/ti_dl/utils/tidlModelGraphviz
make

Importing PeleeNet model for object detection (caffe)
下载并提取.caffemodel，deploy.prototxt放入ti_dl/test/testvecs/models/public/caffe/peele/pelee_voc/
deploy.prototxt中改confidence_threshold: 0.4

cd ${TIDL_INSTALL_PATH}/ti_dl/utils/tidlModelImport
./out/tidl_model_import.out ${TIDL_INSTALL_PATH}/ti_dl/test/testvecs/config/import/public/caffe/tidl_import_peeleNet.txt
#${TIDL_INSTALL_PATH}/ti_dl/test/下面的配置文件在RTOSsdk8.6中找不到，要从SDK8.5复制！！！

#successful Memory allocation
# Compiled network and I/O .bin files used for inference
    # Compiled network file in ti_dl/test/testvecs/config/tidl_models/caffe/tidl_net_peele_300.bin
    # Compiled I/O file in ti_dl/test/testvecs/config/tidl_models/caffe/tidl_io_peele_300_1.bin
# Performance simulation results for network analysis in ti_dl/utils/perfsim/tidl_import_peeleNet.txt/tidl_import_peeleNet...csv

#若是tensorflow例程，.pb需要先运行tensorflow的.local/lib/python3.6/site-packages/tensorflow/python/tools/optimize_for_inference.py工具进行模型推理优化，再导入。

Running PeleeNet for object detection

#在文件ti_dl/test/testvecs/config/config_list.txt顶部加入:
1 testvecs/config/infer/public/caffe/tidl_infer_pelee.txt
0

#运行，结果在ti_dl/test/testvecs/output/
cd ${TIDL_INSTALL_PATH}/ti_dl/test
./PC_dsp_test_dl_algo.out
#若标注框尺寸不匹配，需要改deploy.prototxt文件顶部：dim: 512  dim: 1024

EdgeAI TIDL Tools

EdgeAI TIDL Tools是TI提供的深度学习开发工具，后续会多次用到。

要求：OS——Ubuntu 18.04，Python Version——3.6

OSRT(Open Source Runtimes:TFLite,ONNX,TVM) 作为用户应用程序的顶级推理 API
将子图卸载到 C7x/MMA 以使用TIDL进行加速执行
在 ARM 核心上运行优化代码，以支持 TIDL 不支持的层（支持情况）

Setup - TexasInstruments/edgeai-tidl-tools at 08_06_00_05

sudo apt-get install libyaml-cpp-dev
git clone https://github.com/TexasInstruments/edgeai-tidl-tools.git #failed：手动安装证书 git config --global http.sslVerify false，export GIT_SSL_NO_VERIFY=1
cd edgeai-tidl-tools
git checkout 08_06_00_05
export SOC=am68pa
source ./setup.sh
#Docker Based X86_PC Setup 跳过，不用docker装

#配置变量
export SOC=am68pa
export TIDL_TOOLS_PATH=$(pwd)/tidl_tools
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$TIDL_TOOLS_PATH
export ARM64_GCC_PATH=$(pwd)/gcc-arm-9.2-2019.12-x86_64-aarch64-none-linux-gnu
#配置永久环境变量更方便，sudo gedit /etc/profile，末尾加入如上代码，然后source /etc/profile加载立即生效

#Compile and Validate on X86_PC for cpp_example
mkdir build && cd build
cmake ../examples && make -j && cd ..
source ./scripts/run_python_examples.sh #编译运行
python3 ./scripts/gen_test_report.py    #评估

Image Classification	Object detection	Semantic Segmentation

Edge AI Studio

TI官方提供的云端环境，集成了一系列工具,无需本地搭环境，使用需要申请，提供两个工具：

Model Composer：为 TI 嵌入式处理器训练、优化和编译 AI 模型。支持数据采集，标注，模型训练，以及上板编译，一步到位。目前仅支持分类和检测任务，只能使用modelzoo中的模型进行训练，比如OD任务只有yolox模型，灵活度不高，主打方便快捷。
Model Analyzer：远程连接到真实的评估硬件，基于jupyter notebook，在 TI 嵌入式处理器上部署和测试 AI 模型性能，进行多个模型的Benchmark。前身叫做 TI edge AI cloud。

Model Analyzer

选TDA4VM设备，能使用3h，文件在顶端My Workspace;
进入后分两大板块:

Find your model: Compare model performance, 能查看不同模型在板端的表现，用来选择适合自己需求的模型；
Get model benchmarks：
- Model performance 是配置好的jupyter notebook，无需修改一步步运行即可输出结果；
- 下面重点使用Custom models：

Custom models（onnxRT）

编译模型（在异构模型编译期间，支持的层将被装载到TI-DSP，生成推理所需工件（artifacts））
使用生成的工件进行推理
执行输入预处理和输出后处理
启用调试日志
使用deny-layer编译选项来隔离可能有问题的层并创建额外的模型子图
使用生成的子图工件进行推理
执行输入预处理和输出后处理

Create Onnx runtime with tidl_model_import_onnx library to generate artifacts that offload supported portion of the DL model to the TI DSP.
参数配置见User options for TIDL Acceleration

# 'sess' model compilation options
compile_options = {
    'tidl_tools_path' : os.environ['TIDL_TOOLS_PATH'], #tidl tools 路径
    'artifacts_folder' : output_dir, #编译输出目录
    'tensor_bits' : num_bits,    #量化位数
    'accuracy_level' : accuracy, #精度级别，0快但精度低，1慢但精度高
    'advanced_options:calibration_frames' : len(calib_images),  #设置用于校准模型量化参数的图片
    'advanced_options:calibration_iterations' : 3, #设置校准迭代次数 used if accuracy_level = 1
    'debug_level' : 1, #设置调试级别，级别越高提供的调试信息越详细
    'deny_list' : "MaxPool" #排除ONNXRT不支持的层
}

# 创建一个会话选项对象，可以设置GPU加速、CPU 线程数、精度模式等会话参数
so = rt.SessionOptions() #此处默认参数
# 设置执行提供者列表，包含 TIDLCompilationProvider 和 CPUExecutionProvider
EP_list = ['TIDLCompilationProvider', 'CPUExecutionProvider']
# compile the model with TIDL acceleration by passing required compilation options.
sess = rt.InferenceSession(onnx_model_path, providers=EP_list, provider_options=[compile_options, {}], sess_options=so)
# 载入 ONNX 模型并进行推理。可以使用 sess 对象来进行标准化、预处理、推理等操作，还可以获取模型的输入信息、输出信息、元图信息等
# At the end of model compilation step, model-artifacts for inference will be generated in user specified path.

input_details = sess.get_inputs() # 获取输入数据信息

# 对校准图片进行预处理并进行推理，并将输出结果存储到 output 列表中
for num in tqdm.trange(len(calib_images)):
    output = list(sess.run(None, {input_details[0].name : preprocess_for_onnx_resent18v2(calib_images[num])}))[0]
# Create OSRT inference session with TIDL acceleration option for running inference with generated model artifacts in the above step.

Then using Onnx with the libtidl_onnxrt_EP inference library we run the model and collect benchmark data.

edgeai-tidl-tools:Python Examples
适用于嵌入式应用的深度学习推理参考设计

Others

TIDL-RT（略）

1
2
3

export TIDL_INSTALL_PATH=/home/ywang85/SDK/RTOSSDK/tidl_j721e_08_06_00_10   #设置环境变量
#TARGET_PLATFORM=PC make gv失败：../../inc/itidl_ti.h:91:21: fatal error: ivision.h: No such file or directory
#跳过，不修改code暂时不要rebuild

EdgeAI-Benchmark（ongoing）

EdgeAI-Benchmark提供了一系列针对不同图像识别任务的脚本，包括分类、分割、检测和关键点检测。（使用edgeai-tidl-tools用于模型编译和推理）

环境搭建

文档：setup_instructions，其中pyenv install 3.6可能因为网络原因下载极慢，这时可以先从官网或镜像源下载所需要的包到 ~/.pyenv/cache 目录下，再执行安装命令
此后每次需要激活环境：pyenv activate benchmark

edgeai-tidl-tools/docs/custom_model_evaluation.md

TDA4系列文章：
TDA4①：SDK, TIDL, OpenVX
TDA4②：环境搭建、模型转换、Demo及Tools
TDA4③：YOLOX的模型转换与SK板端运行
 TDA4④：部署自定义模型

Arrow的笔记本

TDA4②：环境搭建，模型转换，Demo及Tools