RNN 时间序列预测里,数据窗口到底该怎么做?
最近在看《Hands-On Machine Learning with Scikit-Learn, Keras & TensorFlow》里关于 RNN 做时间序列预测的内容。我本来以为重点会落在 SimpleRNN 本身,结果实际做下来才发现,真正麻烦的地方往往不是模型,而是怎么把时间序列整理成监督学习的数据集。
这篇文章我就专门梳理这个问题:当我们要用过去 56 天的数据预测未来的地铁客流时,数据窗口到底应该怎么切?
最近在看《Hands-On Machine Learning with Scikit-Learn, Keras & TensorFlow》里关于 RNN 做时间序列预测的内容。我本来以为重点会落在 SimpleRNN 本身,结果实际做下来才发现,真正麻烦的地方往往不是模型,而是怎么把时间序列整理成监督学习的数据集。
这篇文章我就专门梳理这个问题:当我们要用过去 56 天的数据预测未来的地铁客流时,数据窗口到底应该怎么切?
在做 RNN 模型生成任务时,我遇到了一个诡异的问题:模型总是生成重复的字符或词汇。排查了很久才发现,原来是** softmax 被调用了两次**。
今天在处理一个文本解析任务时,遇到了一个让人头疼的问题。本来是一个简单的需求:读取目录下的多个文本文件,每个文件里包含若干个用 <doc> 标签包裹的文档,想要把它们解析成一个 tf.data.Dataset,每个元素是一个文档字符串。
看起来很简单对吧?但就是这个”简单”的需求,让我陷入了 TensorFlow 图执行模式的深坑,也让我重新理解了 Python 闭包和 TensorFlow 的 SymbolicTensor。
又到了一场周六了。每次就只能在周六的时候才能静下心来写文章,梳理最近的学习和心情。周六很快就来了,又很快过去了。正如这春去秋来,花落花开。
闲言少叙,这次我想梳理的知识点是 tf.data,即 TensorFlow 中如何处理数据的。这是我前面提到的书籍《Hands-On Machine Learning with Scikit-Learn, Keras & TensorFlow》中第 13 章的内容。我还是想要依靠记忆拼凑出想要的知识点。
首先,在 PyTorch 大行其道的今日,tf.data 应该是 TensorFlow 没有被侵蚀的最主要领域了。某种程度上,它独立于 TensorFlow,并作为有效地工具完成数据预处理的各项任务。
首先分享一下最近看的两本书:
两本书都到第三版了,阅读时请认准英文原版。
其中第一本书 DLWP 我已经基本读完,第二本 HOML 正在阅读。你可以理解为前者主要在讲 Keras,而后者可以深入到 TensorFlow。这样的阅读顺序我觉得挺好。
言归正传,这篇文章我想谈谈 Keras 的自定义组件,其主要思想来源于 HOML 的第 12 章。具体来讲,涵盖:
在这里面,有一些可以归纳出的点:
__call__ 或者 call 方法;get_config 方法;call 方法之外,还有其他的方法需要实现。总之,这里面有许多东西需要处理和记忆,初看之下还会有些混乱。这篇文章就是在梳理这些内容。
由于篇幅有限,我只捡重要的讲。除了宣导之外,还能帮助我记忆。
Vue 3 使用 v-on 指令表示事件。我们知道 React 中没有事件的,它只有属性的概念。事件是通过函数属性表示的,也就是“回调函数”。既然这样,同样的一个效果,在 Vue 3 中既可以使用事件实现,也可以使用函数属性实现,在实际开发中我们应该怎么抉择呢?
众所周知,相比于 Vue 2,Vue 3 对于 TypeScript 的支持更加完善;但是,依然有一些不够完善的地方。至于有哪些不完善的地方,也不是一下就能说得出来,好像插槽算一个。不管哪一个,对范型组件缺乏支持是它逃不掉的一点。
我们在使用 UI 组件库的时候,像 Select、List 这样的组件,它们天然地不支持范型。这会让你在编写代码时丢失一些必要的类型信息。
这几篇写的都是有关于 watch 监听的,殊不知计算属性也有监听的味道在里面。类似于 watchEffect,计算属性会自动计算依赖,并依据依赖变化自动更新变量值。
1 | const firstName = ref('') |
接下来通过一个菜单组件的例子,介绍计算属性的浅监听可能带来的问题,以及如何克服这样的问题。但文章最后还是提出一个困扰,关于 Vue 提供的深度监听的特性和函数式思维的抉择是我们开发上的一个难点。
watch 通常只能监听值的改变,也就是我们平常所说的“浅”监听。如果要监听深层次的属性,需要加一个选项 deep: true. 但这时,如果监听的变量本身值的改变,和内部属性值的改变,都会触发监听函数。如果我们要区分这两种情况,需要用到一些手段。
本文通过一个路由和变量绑定的案例介绍 watchEffect 的使用技巧、限制和注意事项。我们将知道应当在数据就绪后再参与监听,watch 比 watchEffect 高级应当始终使用 watch 即可。