DKT—Going Deeper with Deep Knowledge Tracing-白红宇

DKT—Going Deeper with Deep Knowledge Tracing

阅读量：643 次

发布时间：2019-03-15

本文共 803 字，大约阅读时间需要 2 分钟。

作为一个刚开始接触深度学习的开发者，我在使用TensorFlow进行模型训练的过程中遇到了一些非常有趣的挑战。最开始，我试图在自己的电脑上用TensorFlow0.12.1进行训练，因为我认为这样可以更直观地理解代码的运行流程。然而，运行一个epoch需要19分钟，这让我感到非常沮丧，尤其是当我第一次尝试使用循环神经网络（RNN）时，处理矩阵和维度的问题变得异常困难。

为了加速训练速度，我决定尝试使用GPU加速。在Google Colab上部署TensorFlow1.15.2 GPU环境后，我发现训练速度提升到了40秒一个epoch，大大减少了等待时间。这让我对深度学习的训练效率有了更深刻的理解，也让我意识到代码优化的重要性。

在迁移TensorFlow版本的过程中，我遇到了不少问题。首先是参数管理方面的困扰，TensorFlow0.12和1.15在参数配置上的差异让我感到非常头疼，尤其是tf.flags的使用方式发生了很大变化。此外，jupyter notebook的运行状态保存也让我的工作效率下降不少，但幸运的是我通过临时存储解决了这一问题。

在代码迁移的过程中，我深刻体会到版本升级带来的变化。我发现很多API只是位置发生了改变，虽然不是很复杂，但对于刚接触TensorFlow的我来说，确实需要花一些时间去适应。通过这次迁移经历，我对TensorFlow的版本迭代有了更清晰的认识，也更明白了代码习惯的重要性。

在研究过程中，我还发现了许多其他值得思考的问题。由于对RNN结构和输入输出模式不够熟悉，我在调试模型的时候经常遇到问题。经过查阅资料和反复实验，我逐渐掌握了处理序列数据的有效方法，也开始更加理解模型设计背后的思路。

通过这次项目，我对深度学习框架的使用有了更全面的了解，同时也培养了一定的问题解决能力。这是我到目前为止在技术学习中遇到的最有挑战性但也最有成就感的经历之一。

转载地址：http://uwymz.baihongyu.com/

你可能感兴趣的文章