A2C (Advantage Actor-Critic) 算法 A2C (Advantage Actor-Critic) Algorithm 算法 设 π(a∣s;θ)\pi(a|s;\theta)π(a∣s;θ) 为当前智能体策略网络,其中 θ\thetaθ 为网络参数,Vπ(S)V_\pi(S)Vπ(S) 为状态价值函数,最优化目标 maxθES[Vπ(S)]=:J(θ)\max_\theta\mathbb{E}_S[V_{\pi}(S)] =: 2023-08-03 强化学习
DQN (Deep Q-Network) 算法 DQN (Deep Q-Network) Algorithm 算法 DQN is based on Q-Learning, it changes the estimate of the Q function from “grid search” to “network search”. It’s an off-policy algorithm, which allow us to store 2023-08-03 强化学习
tf.function笔记 tf.function 参考: YouTube - tf.function and Autograph (TF Dev Summit ‘19) tensorflow.org - tf.function CSDN【Tensorflow教程笔记】常用模块 tf.function :图执行模式 import tensorflow as tf tf.function修饰的函数会将其中 2023-07-25 神经网络框架 > TensorFlow2 #TensorFlow
Inside TensorFlow - tf.keras 笔记 学习视频:YouTube - Inside TensorFlow: tf.Keras (Part 1),YouTube - Inside TensorFlow: tf.Keras (Part 1),这两个视频中介绍了Keras的基本实现原理和每个类的自定义方法。 头文件: import tensorflow as tf import tensorflow.experimental.numpy as 2023-07-23 神经网络框架 > TensorFlow2 #TensorFlow
几何问题 几何相关算法 向量命名空间 用pt命令空间内的Point类,实现基本的向量加减乘除运算,大小比较<以及相等==判断,内积dot和外积cross,向量长度length,向量夹角angle,向量旋转rotate,以及一些求交点,判断是否正规相交,判断是否点在线段上,计算点到直线、线段距离的函数。 #include <cmath> #include <string> #includ 2023-06-06
线段树 线段树操作 线段树二分询问 UVA - 11525 - Permutation,SPOJ - NKMOU - IOI05 Mountains,UVA - 12419 - Heap Manager 本质就是利用线段树是二叉树的性质,如果某个区间信息具有单调关系,那么就可以通过判断左右儿子节点中该信息的大小,判断进入哪个儿子节点。线段树的二分询问一般是要求整个区间上最左或最右侧的某个解,通过维护前 2023-05-30 coding > algorithm #线段树
平行四边形DP优化 平行四边形不等式 2D1D 定义1(平行四边形不等式) 若二元实函数 f(x,y)f(x, y)f(x,y) 满足 ∀l1⩽l2⩽r1⩽r2\forall l_1\leqslant l_2\leqslant r_1\leqslant r_2∀l1⩽l2⩽r1⩽r2,有 f(l1,r1)+f(l2,r2)⩽f(l1,r2)+f(l2,r1)f(l_1,r_1) + f(l_2,r_2) 2023-05-30 coding > algorithm #动态规划
字符串相关算法 字符串 Trie树 UVA - 1401 - Remember the Word - Trie+DP组合,UVA - 11732 - “strcmp()” Anyone? - Trie #define reset(A) memset(A, 0, sizeof(A)) const int maxnode = ...; const int maxc = ...; struct Trie { 2023-05-30 coding > algorithm #字符串
2023算法复习 使用vjudge进行题目评测,减少找题的工作量。 ~/.vimrc 中g++使用F5快速执行代码, autocmd filetype cpp nnoremap <F5> :w <bar> !g++ % -o %:r && ./%:r<CR> 2023.4月 2023.4.24. 《第一章 算法设计基础》 UVA - 11292 2023-05-07 coding > algorithm
ARC159 - AtCoder Regular Contest 159 C. Permutation Addition 题意 给出长度为 NNN 的正整数数列 A={a1,⋯ ,aN}A = \{a_1,\cdots,a_N\}A={a1,⋯,aN},定义一次操作如下: 选择一个 {1,⋯ ,N}\{1,\cdots,N\}{1,⋯,N} 的排列 P={p1,⋯ ,pN}P = \{p_1,\cdots,p_N\}P={p1,⋯,pN},更新 A←{a1 2023-04-11 coding > atcoder #构造题