机器学习理论发展到了什么程度?
2024-05-02
20 阅读
deep learning那些老套就不说了cnn rnn还算了解一些也是reduce成了很多graphical model来理解。主要说reinforcement learning,这东西也是老概念,最早出名的就是88年的sutton的td了。使用bootstrap可以大幅增加学习速度,但是结果就是很不稳定,毕竟是用estimation做update target。最近最有名的无非就是bootstrap套上deep learning那套了,那套理论支持一塌糊涂,基本靠emperical intuition来强行控制target的variance。其实也有一些method是有很好的理论支持的,各种idea都有,有改改gradient让他去适应error,有把非线性的reduce到线性 on policy的。但是他们也有他们自己的问题。所以从理论的角度,现在的情况就是,现在都在用的method你可以prove他perge,不perge的没什么人用。可以说整个rl领域还是非常emperical。一直到现在分析他们还用的老的那套stochastic approx的theory。