root commited on
Commit
5befa6f
·
1 Parent(s): c0eb046

inital push

Browse files
Files changed (23) hide show
  1. data/ta_token_list/bpe_unigram1024/bpe.model +3 -0
  2. exp/asr_stats_raw_copy_ta_bpe1024/train/feats_stats.npz +3 -0
  3. exp/asr_train_asr_streaming_transformer_size_l_raw_copy_ta_bpe1024/RESULTS.md +0 -0
  4. exp/asr_train_asr_streaming_transformer_size_l_raw_copy_ta_bpe1024/config.yaml +1251 -0
  5. exp/asr_train_asr_streaming_transformer_size_l_raw_copy_ta_bpe1024/images/acc.png +0 -0
  6. exp/asr_train_asr_streaming_transformer_size_l_raw_copy_ta_bpe1024/images/backward_time.png +0 -0
  7. exp/asr_train_asr_streaming_transformer_size_l_raw_copy_ta_bpe1024/images/cer.png +0 -0
  8. exp/asr_train_asr_streaming_transformer_size_l_raw_copy_ta_bpe1024/images/cer_ctc.png +0 -0
  9. exp/asr_train_asr_streaming_transformer_size_l_raw_copy_ta_bpe1024/images/clip.png +0 -0
  10. exp/asr_train_asr_streaming_transformer_size_l_raw_copy_ta_bpe1024/images/forward_time.png +0 -0
  11. exp/asr_train_asr_streaming_transformer_size_l_raw_copy_ta_bpe1024/images/gpu_max_cached_mem_GB.png +0 -0
  12. exp/asr_train_asr_streaming_transformer_size_l_raw_copy_ta_bpe1024/images/grad_norm.png +0 -0
  13. exp/asr_train_asr_streaming_transformer_size_l_raw_copy_ta_bpe1024/images/iter_time.png +0 -0
  14. exp/asr_train_asr_streaming_transformer_size_l_raw_copy_ta_bpe1024/images/loss.png +0 -0
  15. exp/asr_train_asr_streaming_transformer_size_l_raw_copy_ta_bpe1024/images/loss_att.png +0 -0
  16. exp/asr_train_asr_streaming_transformer_size_l_raw_copy_ta_bpe1024/images/loss_ctc.png +0 -0
  17. exp/asr_train_asr_streaming_transformer_size_l_raw_copy_ta_bpe1024/images/loss_scale.png +0 -0
  18. exp/asr_train_asr_streaming_transformer_size_l_raw_copy_ta_bpe1024/images/optim0_lr0.png +0 -0
  19. exp/asr_train_asr_streaming_transformer_size_l_raw_copy_ta_bpe1024/images/optim_step_time.png +0 -0
  20. exp/asr_train_asr_streaming_transformer_size_l_raw_copy_ta_bpe1024/images/train_time.png +0 -0
  21. exp/asr_train_asr_streaming_transformer_size_l_raw_copy_ta_bpe1024/images/wer.png +0 -0
  22. exp/asr_train_asr_streaming_transformer_size_l_raw_copy_ta_bpe1024/valid.acc.ave.pth +3 -0
  23. meta.yaml +8 -0
data/ta_token_list/bpe_unigram1024/bpe.model ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:5c586c8fd250bbfdb640b39865398151a45a0004cc1672753ff4f8dbc7c7aa93
3
+ size 265847
exp/asr_stats_raw_copy_ta_bpe1024/train/feats_stats.npz ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:923a3bf1c64bf76cb1c6c6fa50d083a44a9bf0181e888b0817c95217bc05659d
3
+ size 1402
exp/asr_train_asr_streaming_transformer_size_l_raw_copy_ta_bpe1024/RESULTS.md ADDED
File without changes
exp/asr_train_asr_streaming_transformer_size_l_raw_copy_ta_bpe1024/config.yaml ADDED
@@ -0,0 +1,1251 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ config: conf/train_asr_streaming_transformer_size_l.yaml
2
+ print_config: false
3
+ log_level: INFO
4
+ drop_last_iter: false
5
+ dry_run: false
6
+ iterator_type: sequence
7
+ valid_iterator_type: null
8
+ output_dir: exp/asr_train_asr_streaming_transformer_size_l_raw_copy_ta_bpe1024
9
+ ngpu: 1
10
+ seed: 0
11
+ num_workers: 1
12
+ num_att_plot: 0
13
+ dist_backend: nccl
14
+ dist_init_method: env://
15
+ dist_world_size: null
16
+ dist_rank: null
17
+ local_rank: 0
18
+ dist_master_addr: null
19
+ dist_master_port: null
20
+ dist_launcher: null
21
+ multiprocessing_distributed: false
22
+ unused_parameters: false
23
+ sharded_ddp: false
24
+ use_fsdp: false
25
+ min_num_params_fsdp: 30000000.0
26
+ use_deepspeed: false
27
+ deepspeed_config: null
28
+ deepspeed_step_sync: true
29
+ cudnn_enabled: true
30
+ cudnn_benchmark: false
31
+ cudnn_deterministic: true
32
+ use_tf32: false
33
+ collect_stats: false
34
+ write_collected_feats: false
35
+ max_epoch: 20
36
+ patience: 3
37
+ val_scheduler_criterion:
38
+ - valid
39
+ - acc
40
+ early_stopping_criterion:
41
+ - valid
42
+ - acc
43
+ - max
44
+ best_model_criterion:
45
+ - - valid
46
+ - acc
47
+ - max
48
+ keep_nbest_models: 10
49
+ nbest_averaging_interval: 0
50
+ grad_clip: 5
51
+ grad_clip_type: 2.0
52
+ grad_noise: false
53
+ accum_grad: 1
54
+ no_forward_run: false
55
+ resume: true
56
+ train_dtype: float32
57
+ use_amp: false
58
+ max_loss_scale: 10000000000.0
59
+ log_interval: null
60
+ use_matplotlib: true
61
+ use_tensorboard: true
62
+ create_graph_in_tensorboard: false
63
+ use_wandb: false
64
+ wandb_project: null
65
+ wandb_id: null
66
+ wandb_entity: null
67
+ wandb_name: null
68
+ wandb_model_log_interval: -1
69
+ detect_anomaly: false
70
+ use_adapter: false
71
+ adapter: lora
72
+ save_strategy: all
73
+ adapter_conf: {}
74
+ pretrain_path: null
75
+ init_param: []
76
+ ignore_init_mismatch: false
77
+ freeze_param: []
78
+ num_iters_per_epoch: null
79
+ batch_size: 64
80
+ valid_batch_size: null
81
+ batch_bins: 1000000
82
+ valid_batch_bins: null
83
+ train_shape_file:
84
+ - exp/asr_stats_raw_copy_ta_bpe1024/train/speech_shape
85
+ - exp/asr_stats_raw_copy_ta_bpe1024/train/text_shape.bpe
86
+ valid_shape_file:
87
+ - exp/asr_stats_raw_copy_ta_bpe1024/valid/speech_shape
88
+ - exp/asr_stats_raw_copy_ta_bpe1024/valid/text_shape.bpe
89
+ batch_type: folded
90
+ valid_batch_type: null
91
+ fold_length:
92
+ - 80000
93
+ - 150
94
+ sort_in_batch: descending
95
+ shuffle_within_batch: false
96
+ sort_batch: descending
97
+ multiple_iterator: false
98
+ chunk_length: 500
99
+ chunk_shift_ratio: 0.5
100
+ num_cache_chunks: 1024
101
+ chunk_excluded_key_prefixes: []
102
+ chunk_default_fs: null
103
+ chunk_max_abs_length: null
104
+ chunk_discard_short_samples: true
105
+ train_data_path_and_name_and_type:
106
+ - - dump/raw_copy/train/wav.scp
107
+ - speech
108
+ - sound
109
+ - - dump/raw_copy/train/text
110
+ - text
111
+ - text
112
+ valid_data_path_and_name_and_type:
113
+ - - dump/raw_copy/dev/wav.scp
114
+ - speech
115
+ - sound
116
+ - - dump/raw_copy/dev/text
117
+ - text
118
+ - text
119
+ multi_task_dataset: false
120
+ sharded_dataset: false
121
+ allow_variable_data_keys: false
122
+ max_cache_size: 0.0
123
+ max_cache_fd: 32
124
+ allow_multi_rates: false
125
+ valid_max_cache_size: null
126
+ exclude_weight_decay: false
127
+ exclude_weight_decay_conf: {}
128
+ optim: adam
129
+ optim_conf:
130
+ lr: 0.001
131
+ scheduler: warmuplr
132
+ scheduler_conf:
133
+ warmup_steps: 25000
134
+ token_list:
135
+ - <blank>
136
+ - <unk>
137
+ - ம்
138
+ - ு
139
+ - ▁
140
+ - வ
141
+ - ய
142
+ - க்க
143
+ - ்
144
+ - ர்
145
+ - ▁திரு
146
+ - ர
147
+ - ▁அ
148
+ - கள்
149
+ - ி
150
+ - த
151
+ - ன்
152
+ - க
153
+ - ல்
154
+ - ப
155
+ - ம
156
+ - ன
157
+ - ல
158
+ - ட
159
+ - ா
160
+ - த்த
161
+ - து
162
+ - ▁த
163
+ - ▁ப
164
+ - க்
165
+ - ▁இ
166
+ - யில்
167
+ - ரி
168
+ - ிய
169
+ - ▁ம
170
+ - ை
171
+ - ட்ட
172
+ - த்
173
+ - தி
174
+ - ும்
175
+ - ீ
176
+ - ப்ப
177
+ - ▁அவர்
178
+ - ோ
179
+ - க்கு
180
+ - ▁வி
181
+ - ச
182
+ - ே
183
+ - டு
184
+ - டி
185
+ - ▁ஆ
186
+ - வி
187
+ - ங்க
188
+ - ப்
189
+ - ▁ச
190
+ - ▁க
191
+ - ▁இன்று
192
+ - ார்
193
+ - களை
194
+ - ஸ்
195
+ - த்தில்
196
+ - ▁ந
197
+ - ந்த
198
+ - ▁எ
199
+ - ▁என்று
200
+ - ள
201
+ - ▁மற்றும்
202
+ - ில்
203
+ - ▁இந்த
204
+ - ▁உ
205
+ - வு
206
+ - லை
207
+ - ெ
208
+ - ற்ற
209
+ - யா
210
+ - ▁வ
211
+ - ▁அரசு
212
+ - த்து
213
+ - ற
214
+ - ட்
215
+ - ழ
216
+ - ண
217
+ - ரு
218
+ - மை
219
+ - வை
220
+ - ▁மத்திய
221
+ - லா
222
+ - களுக்கு
223
+ - கா
224
+ - ரா
225
+ - யை
226
+ - ▁அமைச்சர்
227
+ - ▁என்றும்
228
+ - ப்பு
229
+ - ▁மாநில
230
+ - வா
231
+ - ▁நூறு
232
+ - ூ
233
+ - ▁கா
234
+ - டை
235
+ - ▁உள்ள
236
+ - று
237
+ - ▁பிரதமர்
238
+ - ▁இரண்டு
239
+ - பா
240
+ - ரை
241
+ - சி
242
+ - த்தை
243
+ - தா
244
+ - த்தி
245
+ - ந
246
+ - னர்
247
+ - ின்
248
+ - ட்டு
249
+ - ளி
250
+ - ங்கள்
251
+ - வில்
252
+ - ▁சி
253
+ - னி
254
+ - ப்படும்
255
+ - களில்
256
+ - ுள்ளது
257
+ - ாக
258
+ - றி
259
+ - மி
260
+ - ▁ஒ
261
+ - ▁பிர
262
+ - ▁பா
263
+ - மாக
264
+ - ுள்ளார்
265
+ - ▁வழங்க
266
+ - ண்ட
267
+ - னை
268
+ - யின்
269
+ - லி
270
+ - ொ
271
+ - ▁ஒன்று
272
+ - ுள்ள
273
+ - ஜ
274
+ - கு
275
+ - ▁தலைவர்
276
+ - ச்ச
277
+ - ▁மு
278
+ - ▁கூறினார்
279
+ - மா
280
+ - ப்பட்ட
281
+ - ▁கு
282
+ - பி
283
+ - ▁இந்தியா
284
+ - ▁பு
285
+ - வும்
286
+ - ▁ஜ
287
+ - ச்
288
+ - த்துறை
289
+ - ▁ஐந்து
290
+ - ▁பணி
291
+ - ▁சு
292
+ - ▁மூன்ற��
293
+ - ந்து
294
+ - ▁தெரிவித்தார்
295
+ - ஷ்
296
+ - ால்
297
+ - ▁நா
298
+ - ள்
299
+ - ▁பி
300
+ - ப்பட
301
+ - கை
302
+ - ▁மா
303
+ - த்திற்கு
304
+ - ப்பட்டுள்ளது
305
+ - ▁தொ
306
+ - ன்ற
307
+ - ▁நான்கு
308
+ - வர்
309
+ - களின்
310
+ - ற்க
311
+ - த்தின்
312
+ - ண்
313
+ - வர
314
+ - ான
315
+ - ூர்
316
+ - ▁கோ
317
+ - ▁இந்திய
318
+ - க்கும்
319
+ - ▁நடவடிக்கை
320
+ - ற்று
321
+ - ▁முதலமைச்சர்
322
+ - ▁ஏ
323
+ - யாக
324
+ - ▁திட்ட
325
+ - மான
326
+ - ுக்கு
327
+ - ▁போ
328
+ - சா
329
+ - ▁துறை
330
+ - தெரிவித்துள்ளார்
331
+ - ▁செய்த
332
+ - ▁ஒரு
333
+ - ▁குறித்து
334
+ - ▁தேதி
335
+ - ▁செய்ய
336
+ - ▁என
337
+ - பு
338
+ - ணி
339
+ - கி
340
+ - ங்களை
341
+ - ப்பி
342
+ - ▁ர
343
+ - ▁வேண்டும்
344
+ - ▁கோவிட்
345
+ - ரிய
346
+ - ▁இரு
347
+ - ▁வரும்
348
+ - ▁கட்ட
349
+ - ட்டி
350
+ - ▁நடைபெற்ற
351
+ - ▁செ
352
+ - னா
353
+ - ▁நி
354
+ - ▁நேற்று
355
+ - களும்
356
+ - ▁வர
357
+ - ▁தி
358
+ - ண்ண
359
+ - ▁கொண்ட
360
+ - தை
361
+ - ▁தேர்தல்
362
+ - ▁கூறியுள்ளார்
363
+ - வே
364
+ - ▁தமிழக
365
+ - ங்
366
+ - தாக
367
+ - ▁நடத்த
368
+ - ▁கட
369
+ - ▁பேசிய
370
+ - ▁மீ
371
+ - ல்ல
372
+ - ▁அணி
373
+ - ▁கோடி
374
+ - ▁முதல்
375
+ - றை
376
+ - ▁நாடு
377
+ - ▁ஆறு
378
+ - ▁கட்சி
379
+ - ழு
380
+ - ▁வா
381
+ - ாய்
382
+ - ▁மணி
383
+ - தன்
384
+ - ▁உள்ளிட்ட
385
+ - ▁இருபத்த
386
+ - ங்களில்
387
+ - யான
388
+ - ▁கே
389
+ - ▁ஊ
390
+ - க்கான
391
+ - ▁முன்
392
+ - ▁ஏழு
393
+ - ிலும்
394
+ - ▁சா
395
+ - '1'
396
+ - ▁ஆண்டு
397
+ - ▁பல்வேறு
398
+ - ▁ரூபாய்
399
+ - ஷ
400
+ - ங்கு
401
+ - ▁பாதுகாப்பு
402
+ - ▁எட்டு
403
+ - ▁தா
404
+ - ▁பொது
405
+ - ▁கி
406
+ - ▁மாவட்ட
407
+ - ுடன்
408
+ - '19'
409
+ - ▁மூலம்
410
+ - ▁ஆயிரத்து
411
+ - ▁சென்னை
412
+ - ▁இட
413
+ - ▁அனைத்து
414
+ - ▁பேர்
415
+ - ிலிருந்து
416
+ - ப்பா
417
+ - ஆம்
418
+ - யும்
419
+ - ▁கூட்ட
420
+ - க்கப்பட்ட
421
+ - ரம்
422
+ - ரோ
423
+ - ▁ஆயிரம்
424
+ - ▁மே
425
+ - ிற்கு
426
+ - ினார்
427
+ - ையும்
428
+ - ▁தலைமை
429
+ - வது
430
+ - ▁நாளை
431
+ - ▁அடுத்த
432
+ - ▁வே
433
+ - ெய்
434
+ - ▁தெரிவித்த
435
+ - யிர
436
+ - ாட்சி
437
+ - க்கி
438
+ - ▁தேசிய
439
+ - கள
440
+ - ற்ப
441
+ - ஞ்ச
442
+ - நிலை
443
+ - ▁என்ற
444
+ - ▁நேர
445
+ - ▁ஹ
446
+ - டா
447
+ - ▁மோடி
448
+ - ▁தொகுதி
449
+ - ▁நிதி
450
+ - ந்திர
451
+ - ோர்
452
+ - கிறது
453
+ - ▁வீ
454
+ - நாட்ட
455
+ - ந்தி
456
+ - ▁பெற்ற
457
+ - ுள்ளதாக
458
+ - ▁அதிக
459
+ - ▁தமிழகத்தில்
460
+ - ▁உலக
461
+ - ▁ஐ
462
+ - ணை
463
+ - ுள்ளனர்
464
+ - ▁நரேந்திர
465
+ - ▁சே
466
+ - ▁மக்கள்
467
+ - ண்டு
468
+ - ▁மருத்துவ
469
+ - ▁கடந்த
470
+ - ▁தெரிவித்துள்ளது
471
+ - வ்
472
+ - ▁ஆய்வு
473
+ - ▁பதி
474
+ - ▁சட்ட
475
+ - நா
476
+ - ▁செய்யப்பட்ட
477
+ - ▁ஒன்பது
478
+ - ▁புதிய
479
+ - ரே
480
+ - ▁வெ
481
+ - ▁போட்டி
482
+ - ▁துணை
483
+ - ண்டி
484
+ - ▁காங்கிரஸ்
485
+ - ▁எதிர்
486
+ - ▁அதிகாரி
487
+ - ▁முறை
488
+ - ▁தெரிவிக்க
489
+ - ▁போட்டியில்
490
+ - ப்படுத்த
491
+ - ▁இது
492
+ - ▁கரு
493
+ - ▁உறுதி
494
+ - ▁தொடங்கி
495
+ - ▁இணை
496
+ - ஹ
497
+ - ▁உத்தர
498
+ - ▁தொற்று
499
+ - ழை
500
+ - ▁ஓ
501
+ - ச்சி
502
+ - ▁தொடங்க
503
+ - கர்
504
+ - லில்
505
+ - ட்ச
506
+ - போது
507
+ - ங்களுக்கு
508
+ - ருக்கு
509
+ - ளை
510
+ - ▁மூ
511
+ - யே
512
+ - ▁பெ
513
+ - ிறார்
514
+ - ▁கால
515
+ - ▁கொ
516
+ - ▁சுகாதார
517
+ - ▁மைய
518
+ - நாள
519
+ - ிருந்த
520
+ - ▁செய்திகள்
521
+ - ▁செய்தி
522
+ - ▁பட்ட
523
+ - தாகவும்
524
+ - ▁செய்தியாளர்களிட
525
+ - ▁புதுச்சேரி
526
+ - ▁கொண்டு
527
+ - ▁ரா
528
+ - தே
529
+ - கொண்ட
530
+ - ப்பட்டு
531
+ - ▁உறுப்பினர்
532
+ - ▁அளிக்க
533
+ - ▁வைத்த
534
+ - ▁வரை
535
+ - ப்பட்டுள்ளதாக
536
+ - ▁கேட்டுக்
537
+ - ▁கை
538
+ - முறை
539
+ - ▁திருமதி
540
+ - ▁நரேந்திரமோடி
541
+ - மீ
542
+ - ▁ஆணைய
543
+ - டைந்த
544
+ - ▁ல
545
+ - மக்கள
546
+ - ▁உயர்
547
+ - ▁பிஜேபி
548
+ - ▁நடைபெறும்
549
+ - ட்டை
550
+ - ▁மேற்கொண்ட
551
+ - ▁தலை
552
+ - ▁வெளி
553
+ - ▁அரசின்
554
+ - ▁குறிப்பிட்��ார்
555
+ - ▁நாற்பத்த
556
+ - ள்ள
557
+ - ▁டாக்டர்
558
+ - வின்
559
+ - ▁வருவதாக
560
+ - ▁செலுத்த
561
+ - ▁ராஜ
562
+ - ழி
563
+ - ▁முப்பத்த
564
+ - ▁விமான
565
+ - கோ
566
+ - ▁தே
567
+ - தால்
568
+ - தற்கு
569
+ - தொடர
570
+ - ▁வெற்றி
571
+ - ▁அமைப்ப
572
+ - தில்
573
+ - களுடன்
574
+ - ▁வளர்ச்சி
575
+ - ▁கூட
576
+ - ▁குழு
577
+ - ▁வழக்க
578
+ - ▁நில
579
+ - ▁எடுக்க
580
+ - ▁பேர
581
+ - ▁சேர்ந்த
582
+ - ▁மக்களவை
583
+ - ▁உள்ளது
584
+ - ▁தொடர்பாக
585
+ - ▁அனுமதி
586
+ - ▁வகையில்
587
+ - முக
588
+ - ரின்
589
+ - ▁நோய்
590
+ - ▁தொடர்ந்து
591
+ - ▁சட்டப்பேரவை
592
+ - ▁மேற்கொள்ள
593
+ - ுதல்
594
+ - ப்பட்டது
595
+ - ▁பொ
596
+ - ▁பாதிக்கப்பட்ட
597
+ - ▁காரணமாக
598
+ - ▁இறுதி
599
+ - விழா
600
+ - ிடம்
601
+ - ▁மேலும்
602
+ - ▁லட்சம்
603
+ - ுமாறு
604
+ - ▁என்றார்
605
+ - ப்படுகிறது
606
+ - ▁சிறப்பு
607
+ - ▁இயக்க
608
+ - ▁ரயில்
609
+ - ▁எடப்பாடி
610
+ - தற்கான
611
+ - ஸ
612
+ - ▁மாவட்டத்தில்
613
+ - ுவது
614
+ - யு
615
+ - ராக
616
+ - யோ
617
+ - சு
618
+ - ▁நல
619
+ - ▁கிரிக்கெட்
620
+ - வெ
621
+ - ▁கொரோனா
622
+ - '0'
623
+ - ப்பை
624
+ - ▁பத்து
625
+ - களுக்கான
626
+ - ▁உதவி
627
+ - ▁தின
628
+ - ▁கல்வி
629
+ - ஆ
630
+ - ரும்
631
+ - ▁அமைக்க
632
+ - ▁தேவை
633
+ - ▁அளித்த
634
+ - ▁அறிவித்த
635
+ - ▁கொள்ள
636
+ - ஜி
637
+ - ▁அறிவிக்க
638
+ - ▁அறிக்கை
639
+ - ▁வந்த
640
+ - கூற
641
+ - ுகின்றன
642
+ - ▁எண்ணிக்கை
643
+ - ▁இருபது
644
+ - ▁முழுவதும்
645
+ - ▁பகுதி
646
+ - எ
647
+ - ▁புதுதில்லியில்
648
+ - ▁மாணவர்
649
+ - ▁ஆலோசனை
650
+ - வாக
651
+ - ▁டி
652
+ - வர்கள்
653
+ - ▁ஐம்பத்து
654
+ - ▁நாட்டின்
655
+ - ▁அறுபத்த
656
+ - ▁வென்ற
657
+ - ▁தகவல்
658
+ - ▁முதல
659
+ - ▁பெற
660
+ - ▁நிலையில்
661
+ - யாளர்
662
+ - ▁பெரு
663
+ - ▁பின்னர்
664
+ - ▁பல
665
+ - களையும்
666
+ - ▁நாடாளுமன்ற
667
+ - ▁எடுத்து
668
+ - ▁முக்கிய
669
+ - ▁மனு
670
+ - ▁கலந்து
671
+ - ப்பட்டுள்ள
672
+ - ▁வைக்க
673
+ - ▁சென்ற
674
+ - ுவதாக
675
+ - ▁இருப்பதாக
676
+ - ▁2
677
+ - ▁வாக்கு
678
+ - ▁உயிரிழந்த
679
+ - ▁இந்தியாவின்
680
+ - ▁பள்ளி
681
+ - ▁அமெரிக்க
682
+ - ▁தாக்கல்
683
+ - ▁நிலைய
684
+ - ▁வங்கி
685
+ - ▁மருத்துவமனை
686
+ - ▁எழுபத்த
687
+ - நி
688
+ - ▁பகுதிகளில்
689
+ - ▁அந்த
690
+ - ▁நிலை
691
+ - ிருப்பதாக
692
+ - ▁தற்போது
693
+ - ▁செயல்பட
694
+ - ▁ரன்
695
+ - ▁இதனை
696
+ - ▁தொழில்
697
+ - ப்படை
698
+ - ுள்ளதாகவும்
699
+ - ▁ஆகிய
700
+ - ▁மழை
701
+ - ▁முழு
702
+ - வரும்
703
+ - ுவதற்கு
704
+ - ியுள்ளது
705
+ - ▁சேவை
706
+ - ▁மாவட்டம்
707
+ - ▁லட்சத்து
708
+ - ▁சதவீத
709
+ - ▁முடிவு
710
+ - ▁இடையே
711
+ - ▁ஏற்படுத்த
712
+ - ▁சர்வதேச
713
+ - ▁குறை
714
+ - ▁அதிகரித்த
715
+ - ▁நடைபெற்று
716
+ - ▁நிறுவன
717
+ - ▁இருந்து
718
+ - ▁பழனிசாமி
719
+ - ▁மாற்ற
720
+ - ▁மாதம்
721
+ - ▁பயன
722
+ - ▁பொருளாதார
723
+ - ▁பயண
724
+ - ▁சூ
725
+ - ▁நிகழ்ச்சி
726
+ - ▁ஏற்பட்ட
727
+ - நகர
728
+ - தற்காக
729
+ - ▁உட்பட
730
+ - பெற்ற
731
+ - ▁சிகிச்சை
732
+ - '5'
733
+ - ஷா
734
+ - ▁திமுக
735
+ - ▁நீதிபதி
736
+ - ▁பூ
737
+ - நாடு
738
+ - ாளர்
739
+ - ுகிறார்
740
+ - ▁நடைபெற
741
+ - ▁கூட்டத்தில்
742
+ - ▁தொடர்பான
743
+ - குமார்
744
+ - ▁நகர
745
+ - ▁இதுவரை
746
+ - ாமல்
747
+ - ▁வழி
748
+ - ▁சிங்
749
+ - ▁இனி
750
+ - ▁ஈ
751
+ - ▁கடை
752
+ - ▁விரிவான
753
+ - ▁அமைச்சகம்
754
+ - ▁அலுவல
755
+ - ெட்
756
+ - ▁நடைபெறவுள்ள
757
+ - ▁வெளியிட்டுள்ள
758
+ - ▁பிரச்சார
759
+ - ▁செல்ல
760
+ - ▁அரசியல்
761
+ - ▁தீவிரவாத
762
+ - ▁ஆளுநர்
763
+ - ▁கண்ட
764
+ - ▁சென்னையில்
765
+ - ▁குடியரசுத்
766
+ - ▁உச்சநீதிமன்ற
767
+ - ிருப்ப
768
+ - ▁ஈடுபட்ட
769
+ - ▁ஐம்பது
770
+ - ▁பிரதேச
771
+ - ▁வசதி
772
+ - கொள்ள
773
+ - ▁தில்லி
774
+ - ▁தமது
775
+ - ▁ராணுவ
776
+ - ▁தேர்வு
777
+ - ▁கூறியுள்ளது
778
+ - ▁உற்பத்தி
779
+ - ▁செயல்
780
+ - யொட்டி
781
+ - வில்லை
782
+ - ப்படுவதாக
783
+ - ▁நிகழ்ச்சியில்
784
+ - ▁காவல்துறை
785
+ - ▁தடுப்பூசி
786
+ - ▁பகுதியில்
787
+ - ▁இதில்
788
+ - ▁நீர்
789
+ - ▁உள்ளதாக
790
+ - ▁செயல்படுத்த
791
+ - களாக
792
+ - '2'
793
+ - யுடன்
794
+ - ▁குறித்த
795
+ - ▁வாய்ப்ப
796
+ - வாழ்
797
+ - ▁பொருட்கள
798
+ - ▁பத்தொன்பது
799
+ - ▁பதவி
800
+ - ங்களின்
801
+ - ▁தடுப்பு
802
+ - ஃ
803
+ - ▁உரையாற்ற
804
+ - ▁கொண்டாட
805
+ - ப்பட்டுள்ளன
806
+ - ▁அமைச்சர
807
+ - ▁குறிப்பிட்ட
808
+ - ▁நாட்டில்
809
+ - ▁விசாரணை
810
+ - ▁சார்பில்
811
+ - ▁முன்னாள்
812
+ - ▁மகளிர்
813
+ - ▁நாள்
814
+ - ▁உருவாக்க
815
+ - ▁புதுவை
816
+ - ▁வெள்ள
817
+ - ▁தமிழ
818
+ - ▁தொழில்நுட்ப
819
+ - ▁பயன்படுத்த
820
+ - ▁இருந்த
821
+ - ▁பாகிஸ்தான
822
+ - ▁அஇஅதிமுக
823
+ - ▁மேற்பட்ட
824
+ - ுவதை
825
+ - ▁ஏற்பாடு
826
+ - ▁3
827
+ - யினர்
828
+ - ▁எதிரான
829
+ - ▁வேளாண்
830
+ - ▁மாலை
831
+ - ▁அதிபர்
832
+ - ▁அரச
833
+ - ▁பரவ
834
+ - ▁வீரர்
835
+ - '7'
836
+ - ▁புள்ளி
837
+ - பெற
838
+ - ▁ஆகியோர்
839
+ - ▁சமூக
840
+ - பிரதேச
841
+ - ▁இடங்களில்
842
+ - ▁கூட்டணி
843
+ - ▁பெண்
844
+ - ▁தேர்தலில்
845
+ - ▁திட்டத்தின்
846
+ - களிலும்
847
+ - ▁பங்கேற்க
848
+ - ▁தேர்தல
849
+ - ▁நிறுவனங்கள
850
+ - ▁20
851
+ - ▁சாலை
852
+ - ▁உள்துறை
853
+ - ▁சட்டமன்ற
854
+ - ▁வெளியுறவு
855
+ - ▁நீதிமன்ற
856
+ - ▁வருவதாகவும்
857
+ - ▁பேருக்கு
858
+ - '4'
859
+ - ▁விளையாட்டு
860
+ - ▁முன்னதாக
861
+ - ▁வருகிறது
862
+ - ▁போக்குவரத்து
863
+ - ▁விருது
864
+ - ▁அறிவுறுத்த
865
+ - ▁கிராம
866
+ - ுவதற்கான
867
+ - ▁நிறைவேற்ற
868
+ - ிருப்பதாகவும்
869
+ - ▁மாவட்டங்களில்
870
+ - ▁விவசாய
871
+ - ▁கீழ்
872
+ - ▁நிர்வாக
873
+ - ▁மேற்கொள்ளப்பட்ட
874
+ - தலைவர்
875
+ - வேண்டும்
876
+ - ▁குறைந்த
877
+ - ▁முடிவ
878
+ - ▁மக்களுக்கு
879
+ - செயல
880
+ - ▁வர்த்தக
881
+ - ▁அனுப்ப
882
+ - யின
883
+ - ▁செய்வத
884
+ - ▁ஆட்டத்தில்
885
+ - ▁மீண்டும்
886
+ - ▁வேண்டுமென்று
887
+ - உ
888
+ - ▁ஆதரவ
889
+ - ▁அம்மாநில
890
+ - ▁வேட்பாளர்
891
+ - ▁எடுத்த
892
+ - ▁ஆட்சி
893
+ - ▁பாதுகாப்ப
894
+ - ▁பங்கேற்ற
895
+ - மாநில
896
+ - ▁விக்கெட்
897
+ - ▁காணொலி
898
+ - ▁பயிற்சி
899
+ - ▁அளவில்
900
+ - ▁தென்
901
+ - ிற்கான
902
+ - ▁மேம்படுத்த
903
+ - ▁வெளியிட
904
+ - ▁எல்லை
905
+ - ▁மருந்து
906
+ - ஐ
907
+ - ிடையே
908
+ - ▁எமது
909
+ - ▁வலியுறுத்திய
910
+ - ▁திறந்து
911
+ - ▁கோவிந்த்
912
+ - ▁வாக்குப்பதிவு
913
+ - நோக்க
914
+ - ▁பரிச
915
+ - ▁ஜெய
916
+ - '6'
917
+ - ▁குற்றம்
918
+ - ூரில்
919
+ - ▁பதினைந்து
920
+ - ▁வலு
921
+ - ▁பதினொன்று
922
+ - ▁ராம்நாத்
923
+ - ▁முப்பது
924
+ - ▁வானிலை
925
+ - ஞ
926
+ - ▁குழந்தை
927
+ - ▁மசோதா
928
+ - ▁ஜம்மு
929
+ - ▁குணமடைந்த
930
+ - ▁பன்னிரண்டு
931
+ - ▁குடியரசு
932
+ - ிலேயே
933
+ - ▁கல்லூரி
934
+ - ▁நாயுடு
935
+ - ▁இரண்டாவது
936
+ - ▁இலங்கை
937
+ - ▁ஒப்பந்த
938
+ - ▁செய்தியாளர்
939
+ - '8'
940
+ - ▁கூறிய
941
+ - ▁பரிசோதனை
942
+ - ▁உணவு
943
+ - ▁வாகன
944
+ - ▁குறிப்பிட
945
+ - முதலமைச்சர
946
+ - மத்திய
947
+ - ▁நிறைவ
948
+ - ▁ஆட்சியர்
949
+ - ▁சந்தித்து
950
+ - ▁வேண்டிய
951
+ - ▁தீவிர
952
+ - ங்களிலும்
953
+ - ▁நடைபெறுகிறது
954
+ - ▁தனியார்
955
+ - ▁வாழ்த்து
956
+ - ▁எதிராக
957
+ - ▁தலைமையிலான
958
+ - ▁மக்களின்
959
+ - ▁நிவாரண
960
+ - ▁யூனியன்
961
+ - ▁உயர்நீதிமன்ற
962
+ - ப்பகுதி
963
+ - ▁நடைமுறை
964
+ - ▁கொள்கை
965
+ - ▁ஏற்பட
966
+ - ▁ஒலிபரப்ப
967
+ - ▁பதினெட்டு
968
+ - ▁கட்டுப்படுத்த
969
+ - ▁இதனிடையே
970
+ - ▁இழப்ப
971
+ - ▁விடுத்துள்ள
972
+ - ▁ஸ்டாலின்
973
+ - ▁சீர
974
+ - ▁பேசினார்
975
+ - ▁பாரத
976
+ - நேர
977
+ - ▁அவரது
978
+ - ▁மும்பை
979
+ - ▁அடிப்படையில்
980
+ - மொழி
981
+ - ▁முயற்சி
982
+ - ▁படையினர
983
+ - ▁மட்டுமே
984
+ - ▁வானொலி
985
+ - ▁பாதிப்பு
986
+ - கொள
987
+ - ▁குடும்ப
988
+ - ▁போராட்ட
989
+ - ▁தீர்ப்ப
990
+ - சுமார்
991
+ - ▁ஸ்ரீ
992
+ - ▁ஆராய்ச்சி
993
+ - ▁தெர
994
+ - ▁வெளியிட்ட
995
+ - கூட்ட
996
+ - ▁செயலர்
997
+ - அ
998
+ - ▁மொத்த
999
+ - ▁பொறுப்ப
1000
+ - ▁இப்போட்டி
1001
+ - ▁ஏற்கனவே
1002
+ - ▁புதிதாக
1003
+ - ▁அதிகரிக்க
1004
+ - ▁அமித்
1005
+ - ▁சதவிகித
1006
+ - ▁கூறியிருக்கிறார
1007
+ - ▁கோரிக்கை
1008
+ - ▁சம்பவ
1009
+ - ▁இரவு
1010
+ - ▁அந்நாட்டு
1011
+ - ▁மாநிலங்களவை
1012
+ - ▁கர்நாடக
1013
+ - ▁மதுரை
1014
+ - ▁ராஜ்நாத்
1015
+ - ▁அமைதி
1016
+ - ▁இல்லை
1017
+ - ▁ஜனநாயக
1018
+ - ▁மேம்பாட்டு
1019
+ - மாவட்ட
1020
+ - ▁அகில
1021
+ - வலியுறுத்த
1022
+ - ▁ஒன்றில்
1023
+ - ▁உரிமை
1024
+ - சம்ப
1025
+ - ▁தொழிலாளர்
1026
+ - ▁இளைஞர்
1027
+ - மேற்
1028
+ - ▁வாயிலாக
1029
+ - ▁பேச்சுவார்த்தை
1030
+ - ▁பதினான்கு
1031
+ - ▁விவசாயிகள்
1032
+ - ▁செயலாளர்
1033
+ - ▁விவாதிக்க
1034
+ - ▁விரைவில்
1035
+ - ▁வாக்காளர்
1036
+ - ▁ஒப்புதல்
1037
+ - ▁நம்பிக்கை
1038
+ - ▁ஆட்சித்தலைவர்
1039
+ - கிருஷ்ண
1040
+ - ▁தொடர்பு
1041
+ - ▁போட்டியிட
1042
+ - ▁காவிரி
1043
+ - ▁விவகார
1044
+ - '3'
1045
+ - ▁சீனா
1046
+ - ▁வைரஸ்
1047
+ - ▁எழுத
1048
+ - காரண
1049
+ - ▁ரூபாய
1050
+ - ▁முன்னேறி
1051
+ - ▁அருகே
1052
+ - ▁என்பது
1053
+ - ▁ஒத்துழைப்பு
1054
+ - ▁பிறந்த
1055
+ - ▁தகுதி
1056
+ - ▁கண்காணிப்ப
1057
+ - தையடுத்து
1058
+ - ▁தூத்துக்குடி
1059
+ - ▁நிர்மலா
1060
+ - ▁எதிர்கொள்கிறது
1061
+ - ▁தமிழ்நாடு
1062
+ - ▁பதிமூன்று
1063
+ - ▁தங்களது
1064
+ - ▁ஈடுபட
1065
+ - ▁நாராயணசாமி
1066
+ - ▁தீர்மான
1067
+ - ▁அனைவரும்
1068
+ - ▁கிடைக்க
1069
+ - ▁பயங்கரவாத
1070
+ - ▁முடியும்
1071
+ - ▁பல்கலைக்கழக
1072
+ - ▁சிறந்த
1073
+ - ▁மீனவர்
1074
+ - ▁இணையதள
1075
+ - ▁ஆகியோர
1076
+ - ▁அமைச்சக
1077
+ - ▁பிரச்சினை
1078
+ - ▁வகுப்பு
1079
+ - ▁வலியுறுத்தினார்
1080
+ - ▁நாற்பது
1081
+ - ▁பதினேழு
1082
+ - ▁எதிர்க்கட்சி
1083
+ - ▁கணக்கில்
1084
+ - ▁ஆகியவற்ற
1085
+ - ▁விழிப்புணர்வு
1086
+ - ▁பேருந்து
1087
+ - ▁தாக்குதல்
1088
+ - ▁பின்பற்ற
1089
+ - ▁சுட்டிக்காட்டின
1090
+ - ▁இதுதொடர்பாக
1091
+ - ▁பதினாறு
1092
+ - ▁பயணிகள
1093
+ - ▁மாநாட்டில்
1094
+ - விவசாயிகள
1095
+ - ▁இயக்குநர்
1096
+ - ▁குஜராத்
1097
+ - ▁அவசியம்
1098
+ - ிருக்கிறார்
1099
+ - ▁பேச்சு
1100
+ - ▁இதற்கிடையே
1101
+ - ▁அமர்வு
1102
+ - '9'
1103
+ - ▁நினைவு
1104
+ - ▁அறிவியல்
1105
+ - உத்தரவிட்டுள்ளது
1106
+ - ▁பட்ஜெட்
1107
+ - ▁சோதனை
1108
+ - ▁ஒதுக்கீடு
1109
+ - க்கூடும்
1110
+ - ▁ஊழியர்
1111
+ - ▁கனமழை
1112
+ - ▁செய்திக்குறிப்ப
1113
+ - ▁சுற்றுச்சூழல
1114
+ - பொருள
1115
+ - ▁உடனடியாக
1116
+ - ▁இங்கிலாந்து
1117
+ - ▁தூய்மை
1118
+ - ▁பேசுகையில்
1119
+ - ▁வருவாய்
1120
+ - ▁இம்மாதம
1121
+ - ▁மரியாதை
1122
+ - ▁நாமக்கல்
1123
+ - நடவடிக்கை
1124
+ - கேட்டுக்கொண்டார்
1125
+ - ▁இக்கூட்டத்தில
1126
+ - ▁மதிப்பிலான
1127
+ - ▁முதலாவது
1128
+ - ▁அடிக்கல்
1129
+ - ▁வித்தியாசத்தில்
1130
+ - இந்நிகழ்ச்சியில்
1131
+ - ▁விஜயபாஸ்கர்
1132
+ - ▁சிறப்பாக
1133
+ - ▁ஆசிரியர்
1134
+ - ▁அறுபது
1135
+ - ▁குடி��ீர்
1136
+ - ▁ஒருங்கிணைந்த
1137
+ - ▁இதுகுறித்து
1138
+ - ▁மேலாண்மை
1139
+ - ▁கொள்வத
1140
+ - ▁அறிவிப்ப
1141
+ - ▁பேரிடர்
1142
+ - நெறிமுறைகள
1143
+ - ▁கலந்துரையாட
1144
+ - ▁ஒவ்வொரு
1145
+ - ▁தேர்ந்தெடுக்க
1146
+ - ▁பாதுகாக்க
1147
+ - ▁நிதியமைச்சர்
1148
+ - விநியோக
1149
+ - ஏ
1150
+ - இ
1151
+ - ஒ
1152
+ - ஊ
1153
+ - ஈ
1154
+ - ஓ
1155
+ - ஔ
1156
+ - ங
1157
+ - ௌ
1158
+ - <sos/eos>
1159
+ init: null
1160
+ input_size: null
1161
+ ctc_conf:
1162
+ dropout_rate: 0.0
1163
+ ctc_type: builtin
1164
+ reduce: true
1165
+ ignore_nan_grad: null
1166
+ zero_infinity: true
1167
+ brctc_risk_strategy: exp
1168
+ brctc_group_strategy: end
1169
+ brctc_risk_factor: 0.0
1170
+ joint_net_conf: null
1171
+ use_preprocessor: true
1172
+ use_lang_prompt: false
1173
+ use_nlp_prompt: false
1174
+ token_type: bpe
1175
+ bpemodel: data/ta_token_list/bpe_unigram1024/bpe.model
1176
+ non_linguistic_symbols: null
1177
+ cleaner: null
1178
+ g2p: null
1179
+ speech_volume_normalize: null
1180
+ rir_scp: null
1181
+ rir_apply_prob: 1.0
1182
+ noise_scp: null
1183
+ noise_apply_prob: 1.0
1184
+ noise_db_range: '13_15'
1185
+ short_noise_thres: 0.5
1186
+ aux_ctc_tasks: []
1187
+ frontend: default
1188
+ frontend_conf:
1189
+ n_fft: 512
1190
+ win_length: 400
1191
+ hop_length: 160
1192
+ fs: 16k
1193
+ specaug: specaug
1194
+ specaug_conf:
1195
+ apply_time_warp: true
1196
+ time_warp_window: 5
1197
+ time_warp_mode: bicubic
1198
+ apply_freq_mask: true
1199
+ freq_mask_width_range:
1200
+ - 0
1201
+ - 30
1202
+ num_freq_mask: 2
1203
+ apply_time_mask: true
1204
+ time_mask_width_range:
1205
+ - 0
1206
+ - 40
1207
+ num_time_mask: 2
1208
+ normalize: global_mvn
1209
+ normalize_conf:
1210
+ stats_file: exp/asr_stats_raw_copy_ta_bpe1024/train/feats_stats.npz
1211
+ model: espnet
1212
+ model_conf:
1213
+ ctc_weight: 0.3
1214
+ lsm_weight: 0.1
1215
+ length_normalized_loss: false
1216
+ preencoder: null
1217
+ preencoder_conf: {}
1218
+ encoder: contextual_block_transformer
1219
+ encoder_conf:
1220
+ output_size: 256
1221
+ attention_heads: 8
1222
+ linear_units: 2048
1223
+ num_blocks: 22
1224
+ dropout_rate: 0.1
1225
+ positional_dropout_rate: 0.1
1226
+ attention_dropout_rate: 0.0
1227
+ input_layer: conv2d
1228
+ normalize_before: true
1229
+ block_size: 40
1230
+ hop_size: 16
1231
+ look_ahead: 16
1232
+ init_average: true
1233
+ ctx_pos_enc: true
1234
+ postencoder: null
1235
+ postencoder_conf: {}
1236
+ decoder: transformer
1237
+ decoder_conf:
1238
+ attention_heads: 8
1239
+ linear_units: 2048
1240
+ num_blocks: 12
1241
+ dropout_rate: 0.1
1242
+ positional_dropout_rate: 0.1
1243
+ self_attention_dropout_rate: 0.0
1244
+ src_attention_dropout_rate: 0.0
1245
+ preprocessor: default
1246
+ preprocessor_conf: {}
1247
+ required:
1248
+ - output_dir
1249
+ - token_list
1250
+ version: '202402'
1251
+ distributed: false
exp/asr_train_asr_streaming_transformer_size_l_raw_copy_ta_bpe1024/images/acc.png ADDED
exp/asr_train_asr_streaming_transformer_size_l_raw_copy_ta_bpe1024/images/backward_time.png ADDED
exp/asr_train_asr_streaming_transformer_size_l_raw_copy_ta_bpe1024/images/cer.png ADDED
exp/asr_train_asr_streaming_transformer_size_l_raw_copy_ta_bpe1024/images/cer_ctc.png ADDED
exp/asr_train_asr_streaming_transformer_size_l_raw_copy_ta_bpe1024/images/clip.png ADDED
exp/asr_train_asr_streaming_transformer_size_l_raw_copy_ta_bpe1024/images/forward_time.png ADDED
exp/asr_train_asr_streaming_transformer_size_l_raw_copy_ta_bpe1024/images/gpu_max_cached_mem_GB.png ADDED
exp/asr_train_asr_streaming_transformer_size_l_raw_copy_ta_bpe1024/images/grad_norm.png ADDED
exp/asr_train_asr_streaming_transformer_size_l_raw_copy_ta_bpe1024/images/iter_time.png ADDED
exp/asr_train_asr_streaming_transformer_size_l_raw_copy_ta_bpe1024/images/loss.png ADDED
exp/asr_train_asr_streaming_transformer_size_l_raw_copy_ta_bpe1024/images/loss_att.png ADDED
exp/asr_train_asr_streaming_transformer_size_l_raw_copy_ta_bpe1024/images/loss_ctc.png ADDED
exp/asr_train_asr_streaming_transformer_size_l_raw_copy_ta_bpe1024/images/loss_scale.png ADDED
exp/asr_train_asr_streaming_transformer_size_l_raw_copy_ta_bpe1024/images/optim0_lr0.png ADDED
exp/asr_train_asr_streaming_transformer_size_l_raw_copy_ta_bpe1024/images/optim_step_time.png ADDED
exp/asr_train_asr_streaming_transformer_size_l_raw_copy_ta_bpe1024/images/train_time.png ADDED
exp/asr_train_asr_streaming_transformer_size_l_raw_copy_ta_bpe1024/images/wer.png ADDED
exp/asr_train_asr_streaming_transformer_size_l_raw_copy_ta_bpe1024/valid.acc.ave.pth ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:066b5d5032b43a1aa7091450781c3f2d583fc8946f003e20688ae19f4a951857
3
+ size 202353200
meta.yaml ADDED
@@ -0,0 +1,8 @@
 
 
 
 
 
 
 
 
 
1
+ espnet: '202402'
2
+ files:
3
+ asr_model_file: exp/asr_train_asr_streaming_transformer_size_l_raw_copy_ta_bpe1024/valid.acc.ave.pth
4
+ python: 3.10.12 (main, Sep 11 2024, 15:47:36) [GCC 11.4.0]
5
+ timestamp: 1729697681.309419
6
+ torch: 2.3.0+cu121
7
+ yaml_files:
8
+ asr_train_config: exp/asr_train_asr_streaming_transformer_size_l_raw_copy_ta_bpe1024/config.yaml