change language tag

haoruilee · web-flow · commit 6286e51704b5 · 2022-04-29T18:09:22.000+08:00
diff --git a/docs/wiki/Translation Of Input Pipeline Performance Guide(输入流水线性能指南).md b/docs/wiki/Translation Of Input Pipeline Performance Guide(输入流水线性能指南).md
@@ -21,7 +21,7 @@ GPU 和 TPU 可以从根本上减少执行单个训练步骤所需的时间。
 
 使用[`tf.estimator.Estimator`](https://www.tensorflow.org/api_docs/python/tf/estimator/Estimator)API 时，前两个阶段（提取和转换）在`input_fn`传递给[`tf.estimator.Estimator.train`](https://www.tensorflow.org/api_docs/python/tf/estimator/BaselineClassifier#train). 在代码中，这可能看起来像以下（幼稚的、顺序的）实现：
 
-```cpp
+```python
 def parse_fn(example):
   "Parse TFExample records and perform simple data augmentation."
   example_fmt = {
@@ -66,14 +66,14 @@ API通过转换[`tf.data`](https://www.tensorflow.org/api_docs/python/tf/data)
 
 要将此更改应用于我们正在运行的示例，请更改：
 
-```cpp
+```python
 dataset = dataset.batch(batch_size=FLAGS.batch_size)
 return dataset
 ```
 
 为：
 
-```cpp
+```python
 dataset = dataset.batch(batch_size=FLAGS.batch_size)
 dataset = dataset.prefetch(buffer_size=FLAGS.prefetch_buffer_size)
 return dataset
@@ -93,28 +93,28 @@ return dataset
 
 要将此更改应用于我们正在运行的示例，请更改：
 
-```cpp
+```python
 dataset = dataset.map(map_func=parse_fn)
 ```
 
 为：
 
-```cpp
+```python
 dataset = dataset.map(map_func=parse_fn, num_parallel_calls=FLAGS.num_parallel_calls)
 ```
 
 此外，如果您的批处理大小为数百或数千，您的流水线可能还会从并行创建批处理中受益。为此，[`tf.data`](https://www.tensorflow.org/api_docs/python/tf/data)API 提供了[`tf.contrib.data.map_and_batch`](https://www.tensorflow.org/api_docs/python/tf/contrib/data/map_and_batch)转换，它有效地“融合”了地图和批量转换。
 
 要将此更改应用于我们正在运行的示例，请更改：
 
-```cpp
+```python
 dataset = dataset.map(map_func=parse_fn, num_parallel_calls=FLAGS.num_parallel_calls)
 dataset = dataset.batch(batch_size=FLAGS.batch_size)
 ```
 
 为：
 
-```cpp
+```python
 dataset = dataset.apply(tf.contrib.data.map_and_batch(
     map_func=parse_fn, batch_size=FLAGS.batch_size))
 ```
@@ -136,13 +136,13 @@ dataset = dataset.apply(tf.contrib.data.map_and_batch(
 
 要将此更改应用于我们正在运行的示例，请更改：
 
-```cpp
+```python
 dataset = files.interleave(tf.data.TFRecordDataset)
 ```
 
 为：
 
-```cpp
+```python
 dataset = files.apply(tf.contrib.data.parallel_interleave(
     tf.data.TFRecordDataset, cycle_length=FLAGS.num_parallel_readers))
 ```
@@ -186,4 +186,4 @@ dataset = files.apply(tf.contrib.data.parallel_interleave(
 - 向量化传入转换的廉价用户定义函数，`map`以分摊与调度和执行函数相关的开销。
 - 如果您的数据可以放入内存，请`cache`在第一个 epoch 期间使用转换将其缓存在内存中，以便后续 epoch 可以避免与读取、解析和转换相关的开销。
 - 如果您的预处理增加了数据的大小，我们建议首先应用`interleave`、`prefetch`和`shuffle`（如果可能）以减少内存使用量。
-- 我们建议在最好在应用`repeat`转换之前应用转换`shuffle`，理想情况下使用融合的`shuffle_and_repeat`转换。
+- 我们建议在最好在应用`repeat`转换之前应用转换`shuffle`，理想情况下使用融合的`shuffle_and_repeat`转换。