English | 日本語

2018.3 SDSoC™ 開発環境チュートリアルほかのバージョンを参照
概要
概要	演習 1: SDSoC 開発環境の概要	演習 2: パフォーマンスの見積もり	演習 3: アプリケーションコードの最適化	演習 4: 指示子を使用したアクセラレータの最適化
演習 5: タスクレベルのパイプライン	演習 6: デバッグ	演習 7: ハードウェアデバッグ	演習 8: エミュレーション	演習 9: GitHub からのサンプルのインストール

演習 5: タスクレベルのパイプライン

この演習では、SDx IDE で生成されたハードウェア/ソフトウェアシステムをタスクレベルのパイプライン処理を使用して最適化するためにコードを変更する方法について説明します。パイプライン処理のパフォーマンスに対する影響を確認します。

📌 注記: このチュートリアルは、ZC702 ボードがなくても終了できます。SDSoC 環境プロジェクトを作成する際に、ボードを選択してください。このチュートリアルでは、ZC702 のアプリケーション用に作成されたソースファイルを追加するように記述されています。ボードにより小型の Zynq-7000 デバイスが含まれる場合は、ソースファイルを追加した後に mmult_accel.cpp ファイルを編集して、リソース使用率を減らしてください。たとえば、アクセラレータソースファイルの場合は、#pragma_HLS_array_partition で block factor=16 と設定されていますが、block factor=8 と設定します。

タスクのパイプライン処理

アプリケーションにアクセラレータへの呼び出しが複数ある場合、これらの呼び出しをパイプライン処理して、設定およびデータ通信とアクセラレータ計算が並列処理されるように構成できます。行列乗算アプリケーションの場合は、次のイベントが実行されます。

行列 A と B がメインメモリからアクセラレータのローカルメモリに転送されます。
アクセラレータが実行されます。
結果 C がアクセラレータからメインメモリに戻されます。

次の図の左側に行列乗算デザイン、右側に順次実行される連続した 2 つの呼び出しに対するこれらのイベントのタイムチャートを示します。

次の図に、これら 2 つの呼び出しをパイプライン処理して実行した場合を示します。2 番目の呼び出しのデータ転送は、最初の呼び出しのデータ転送が終わるとすぐに開始し、最初の呼び出しの実行と同時に実行されます。ただし、パイプライン処理をイネーブルにするには、アクセラレータが 1 つ目の引数セットを使用して計算を実行している間、2 番目の引数セットを格納しておくローカルメモリが必要です。SDSoC 環境では、ユーザーの指定に基づき、このためにマルチバッファーと呼ばれるメモリが生成されます。

タスクレベルのパイプライン処理を指定するには、async(id) および wait(id) プラグマを使用して呼び出しコードを記述し直す必要があります。SDSoC 環境には、async プラグマの使用方法を示すサンプルが含まれており、このチュートリアルではこの行列乗算パイプライン処理のサンプルを使用します。

行列乗算サンプルでのタスクのパイプライン処理

SDx IDE には、タスクレベルのパイプライン処理をインプリメントする async プラグマの使用方法を示す行列乗算のパイプライン処理のサンプルが含まれています。この演習では、この手法を使用することによるランタイムの向上を確認します。

[File] → [New] → [SDx Project] をクリックし、新しい SDx プロジェクト (lab5) を作成します。[Project name] に lab5 と入力し、[Platform] に [zc702]、[System Configuration] に [Linux] を選択して [Next] をクリックします。
選択したプラットフォーム用のソースコード例をリストする [Templates] ページが表示されます。[Available Templates] から [Empty Application] を選択し、[Finish] をクリックします。
使用しているオペレーティングシステムのファイルマネージャーを使用し <path to install>/SDx/2018.2/samples/mmult_pipelined を開き、そのディレクトリにあるソースファイル (mmult_accel.cpp、mmult_accel.h、mmult.cpp) を作成したプロジェクトの src フォルダー (例: ./lab5/src) にコピーします。
SDx で [lab5] をクリックして、コンテキストメニューから [Refresh] をクリックします。これで前の段階でコピーしたすべてのソースがプロジェクトに追加されます。
ビルドコンフィギュレーションを [Release] に変更します。
mmult_accel.cpp ファイルの mmult_accel 関数を、[SDx Project Settings] で [Add HW Functions] アイコンをクリックするか、[Project Explorer] タブで右クリックして [Toggle HW/SW] をクリックしてマークします。
プロジェクトをビルドします。
sd_card フォルダーのファイルを SD カードにコピーし、ターミナルを設定して、ボード上で生成されたアプリケーションを実行します。アプリケーションの引数としてパイプライン段数を指定する必要があります。パイプラン段数を 1、2、および 3 に設定してアプリケーションを実行し、パフォーマンスを記録します。

まとめ

このチュートリアルを終了すると、次ができるようになります。

SDx IDE 環境を使用してタスクレベルのパイプライン処理を実行することにより、アプリケーションを実行時間を短縮するよう最適化。
アクセラレータでの計算と入力および出力通信を同時に実行するアクセラレータへのパイプライン呼び出しのパフォーマンスに対する影響を確認。

この資料は表記のバージョンの英語版を翻訳したもので、内容に相違が生じる場合には原文を優先します。資料によっては英語版の更新に対応していないものがあります。日本語版は参考用としてご使用の上、最新情報につきましては、必ず最新英語版をご参照ください。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

lab-5-task-level-pipelining.md

lab-5-task-level-pipelining.md

2018.3 SDSoC™ 開発環境チュートリアル

概要

演習 5: タスクレベルのパイプライン

まとめ

Files

lab-5-task-level-pipelining.md

Latest commit

History

lab-5-task-level-pipelining.md

File metadata and controls

2018.3 SDSoC™ 開発環境チュートリアル

概要

演習 5: タスク レベルのパイプライン

まとめ

演習 5: タスクレベルのパイプライン