2019.1 SDAccel™ 開発環境チュートリアル

See other versions

はじめての SDAccel プログラムの作成

2. はじめてのホストプログラムの記述

カーネルを記述したら、次はホストアプリケーションについて学びます。ホストアプリケーションは、OpenCL API 呼び出しを使用して C または C++ のいずれかで記述され、FPGA アクセラレータとの交信に使用されます。

C++ バージョンと C バージョンの両方を示すサンプルホストコードは ./reference-files/src フォルダーに含まれています。このチュートリアルでは、C ++ バージョンのみを確認します。

C++ バージョンのホストコードは、host.cpp ファイルに含まれています。
C バージョンのホストコードは、host.c ファイルに含まれています。

通常、ホストアプリケーションの構造は次の 3 つのセクションに分けることができます。

ハードウェアの設定。
カーネルの実行。
カーネルリターン後のハードウェアリソースのリリース。

このチュートリアルでは、それぞれの手順を実行します。

ハードウェアの設定

アプリケーションは、FPGA を設定して初期化するところから開始する必要があります。これには、通常次の手順を実行します。

使用可能なザイリンクスプラットフォームのリストを読み出します。
各ザイリンクスプラットフォームでサポートされるデバイスのリストを読み出します。
コンテキストを作成します。
コンパイル済み FPGA バイナリ (xclbin) からプログラムオブジェクトを作成します。
カーネルオブジェクトを作成します。

このセクションの手順を実行するには、host.cpp ファイルの手順 1 を参照してください。

ヒント: この演習では C++ コードを使用しますが、C コードもリファレンスファイルに含まれています。特定の OpenCL API 呼び出しに関する詳細は、OpenCL リファレンスページを参照してください。

アプリケーションは、ザイリンクス FPGA デバイスに含まれるプラットフォームを見つけるところから開始します。ザイリンクスプラットフォームが含まれているかどうかは、cl::Platform::get OpenCL API を使用するとわかります。この呼び出しを実行すると、システム内で使用可能なプラットフォームが返されます。
```
cl::Platform::get(&platforms)
```
使用可能なプラットフォームを読み出したら、ホストが特定ベンダーのプラットフォームを検証します。各プラットフォームにベンダーのインストールが含まれるので、システムにはさまざまなプラットフォームが混合している可能性があります。cl::platform.getInfo API 呼び出しは、使用可能な OpenCL プラットフォームに関する特定の情報を返します。このホストコードでは、プラットフォームのベンダー情報を読み出して、それをユーザー入力の XILINX で確認します。
```
 platform.getInfo<CL_PLATFORM_NAME>(&err)
```
次に、ホストが該当するプラットフォームから特定のデバイスを選択する必要があります。これには cl::platform::getDevices API を使用します。
```
platform.getDevices(CL_DEVICE_TYPE_ACCELERATOR, &devices)
```
注記: 現時点の C++ コードでは、上記の動作がまとめられて、host.hpp ファイル内のユーザー定義の get_devices("Xilinx") 内に含まれています。
```
get_devices("Xilinx")
```
プラットフォームとデバイスを選択したら、コンテキストを作成する必要があります。コンテキストは、ランタイムがコマンドキューおよびカーネルオブジェクトなどのオブジェクトを管理するために使用されます。コンテキストは cl::Context OpenCLAPI を使用して作成します。
```
cl::Context context(device, NULL, NULL, NULL, &err))
```
コンテキストを作成したら、コマンドキューを作成します。アプリケーションは、データ転送、カーネル実行、同期などの動作のコマンドをこのキューに含めます。この後、これらのコマンドがそのコンテキスト内で、デバイスでスケジューリングされます。コマンドキューは、cl::CommandQueue OpenCL API を使用して作成します。
```
cl::CommandQueue q(context, device, CL_QUEUE_PROFILING_ENABLE, &err)
```
次に、プログラムオブジェクトを作成する必要があります。プログラムオブジェクトは、コンパイル済み FPGA バイナリファイル (xclbin) から作成されます。含まれるのは、ユーザー定義のカーネル関数のコレクションで、これが FPGA にプログラムされます。

ヒント: アプリケーションのビルドで説明したように、xclbin は作成したコンパイル済みのカーネルバイナリです。

まず、アプリケーションが xclbin ファイルの内容を読み出す必要があります。このチュートリアルでは、ユーザー定義の関数 read_binary_file を使用します。この関数は、xclbin ファイルの内容へポインターを返します。
```
fileBuf = read_binary_file(binaryFile, fileBufSize)
```
この後、cl::Program::Binaries オブジェクトを作成して、xclbin バイナリファイルの内容を格納します。
```
cl::Program::Binaries bins{{fileBuf, fileBufSize}}
```
最後にプログラムオブジェクトを作成し、bins 変数に格納された xclbin バイナリの内容で初期化します。これには cl::Program program API を使用します。
```
cl::Program program(context, devices, bins, NULL, &err)
```
この手順では、FPGA を bins 変数に読み込んだバイナリを使用してプログラムします。問題なく終了したら、CL_SUCCESS と表示されます。
次に、カーネルオブジェクトを作成する必要があります。カーネルオブジェクトは、どのソフトウェアアプリケーションを使用して、引数を実際のハードウェアカーネルに渡して実行するかを決めます。カーネルオブジェクトは cl::Kernel API を使用して作成されます。
```
cl::Kernel krnl_vector_add(program,"vadd", &err)
```

注記: 説明した動作はほとんどのアプリケーションで同じなので、再利用できます。

カーネルの実行

ハードウェアを設定したので、ホストアプリケーションがデバイスに対してコマンドを発行し、カーネルと交信する準備ができました。これらのコマンドには、次が含まれます。

FPGA デバイスのバッファー転送
カーネル引数の設定
FPGA でのカーネルの実行
イベントの同期

このセクションの手順を実行するには、host.cpp ファイルの手順 2 を参照してください。

まず、グローバルメモリにバッファーを作成する必要があります。バッファーは、ホストとデバイス間のデータ転送に使用されます。カーネルはこれらのバッファーからデータを読み出し、処理して、バッファーに書き戻します。バッファーオブジェクトは cl::Buffer API を使用して作成します。
```
cl::Buffer buffer_in1 (context,CL_MEM_USE_HOST_PTR | CL_MEM_READ_ONLY, vector_size_bytes, source_in1.data(), &err)
```
次のバッファーを作成します。
- buffer_in1: source_in1 を格納
- buffer_in2: source_in2 を格納
- buffer_output: 結果 (source_hw_results) を格納
カーネルを実行する前に、その引数をそれぞれ設定する必要があります。カーネル引数は、スカラー値かバッファーオブジェクトのいずれかです。カーネル引数は cl::Kernel::setArg API を使用して設定します。
```
krnl_vector_add.setArg(0, buffer_in1)
```
これにより、カーネルに入力データの含まれる箇所、出力を格納する箇所、各バッファーのサイズなどを示すポインターが渡されます。次の引数が設定されています。
- in1 (入力): 入力ベクター 1
- in2 (入力): 入力ベクター 2
- out (出力): 出力ベクター
- size (入力): ベクターのサイズ (整数)
まず、cl::CommandQueue::enqueueMigrateMemObjects API を使用し、ホストメモリからデバイスメモリ (グローバルメモリ) への入力データの転送を要求します。
```
q.enqueueMigrateMemObjects({buffer_in1, buffer_in2},0/* 0 means from host*/)
```
次に、cl::CommandQueue::enqueueTask API を使用してカーネルの実行を要求します。
```
q.enqueueTask(krnl_vector_add)
```
この後、デバイスのグローバルメモリからホストメモリへの出力結果の転送を要求します。これには cl::CommandQueue::enqueueMigrateMemoryObjects API を使用します。
```
q.enqueueMigrateMemObjects({buffer_output},CL_MIGRATE_MEM_OBJECT_HOST)
```
最後に、コマンドキューに含んだすべての要求が終了するのを待ちます。
```
q.finish();
```
エンキューした API 呼び出しは実際に指定したコマンドを実行するわけではなく、その実行を要求するだけです。エンキューした関数が返されても、コマンドが実際に実行されたわけではありません。コマンドの実行をスケジュールするのは、ランタイムです。このため、アプリケーションが同期手法を使用して、コマンドの終了するタイミングを知る必要があります。

アプリケーションリターン後の FPGA のリリース

ホストアプリケーションのビルドの最後の手順は、オブジェクトのリリースです。このセクションの手順を実行するには、host.cpp ファイルの手順 3 を参照してください。C++ ラッパーは、オブジェクトがスコープ外に渡されると、そのオブジェクトを自動的にリリースします。

次のステップ

次は、アプリケーションおよびカーネルをコンパイル、リンク、実行します。

メインページに戻る — 入門コースの初めに戻る

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

host_program.md

host_program.md

2019.1 SDAccel™ 開発環境チュートリアル

はじめての SDAccel プログラムの作成

2. はじめてのホストプログラムの記述

ハードウェアの設定

カーネルの実行

アプリケーションリターン後の FPGA のリリース

次のステップ

Files

host_program.md

Latest commit

History

host_program.md

File metadata and controls

2019.1 SDAccel™ 開発環境チュートリアル

はじめての SDAccel プログラムの作成

2. はじめてのホスト プログラムの記述

ハードウェアの設定

カーネルの実行

アプリケーション リターン後の FPGA のリリース

次のステップ

2. はじめてのホストプログラムの記述

アプリケーションリターン後の FPGA のリリース