Mrli
别装作很努力,
因为结局不会陪你演戏。
Contacts:
QQ博客园

Mr.li's Blog

Welcome to my Blog!
蒙特卡洛树搜索MCTS
蒙特卡洛树搜索MCTS 跟围棋的关联 AlphaGo AlphaGo Zero 蒙特卡洛树搜索——内含用于树遍历的 PUCT 函数的某些变体 残差卷积神经网络——其中的策略和价值网络被用于评估棋局,以进行下一步落子位置的先验概率估算。 强化学习——通过自我对弈进行神经网络训练 AlphaGo Zero跟AlphaGo的最大区别是抛弃人类棋谱的,完全通过自我对弈来学会下棋的,并且仅用40小时就到达了AlphaGo的棋力。 过程是这样,首先生成棋谱,然后将棋谱作为输入训练神经网络,训练好的神经网络用来预测落子和胜率。如下图: 在AlphaGo Zero中蒙特卡洛树搜索主要是用来生成棋 ...

搭建Jupyter、JupyterLab服务器
搭建Jupyter服务器 1.配置好Python环境及安装pip 2.安装jupyter: pip3 install jupyter (此处使用的是python3) 3.生成配置文件 jupyter notebook --generate-config 4.生成密钥: 终端输入$ ipython 123456In [1]: from notebook.auth import passwdIn [2]: passwd()Enter password: Verify password: #此时会让你两次输入密码,然后就会生成秘钥#************ 5.修改配置文件vim ~/.jupyt ...

Ubuntu16.04+CUDA toolkit10.1+cudNN7.6+bazel0.26.1
Ubuntu 16.04 + CUDA toolkit 10.1 + cudNN7.6 + bazel 0.26.1 保证cuDNN跟CUDA SDK的版本一致即可. 从源码编译的话需要查看显卡的计算能力,可在查看GPU计算能力,在配置的时候填入即可,跟CUDA SDK的版本无关 ▲必须注册账号后,才能选择下载 ▲最好先看我的踩坑记录,先确保自己知道有这些坑 ▲.全程保持能连接外网(翻墙) 安装NVIDIA驱动 123$ ubuntu-drivers devices # 查看# 查看NVIDIA驱动版本$ sudo dpkg --list | grep nvidia-* 显卡驱动与CU ...

OpenAI Gym使用、rendering画图
OpenAI Gym使用、rendering画图 gym开源库:包含一个测试问题集,每个问题成为环境(environment),可以用于自己的RL算法开发。这些环境有共享的接口,允许用户设计通用的算法。其包含了deep mind 使用的Atari游戏测试床。 在强化学习中有2个基本概念,一个是环境(environment),称为外部世界,另一个为智能体agent(写的算法)。agent发送action至environment,environment返回观察和回报。 Gym官方文档 Hello gym 123456789import gym# 创建一个小车倒立摆模型env = gym.m ...

Python多进程
Python多进程 守护进程 守护进程其实就是**“子进程“是否伴随主进程一起结束**:守护==>伴随,即守护进程会伴随主进程的代码运行完毕后而死掉 进程:当父进程需要将一个任务并发出去执行,需要将该任务放到以个子进程里 守护:当该子进程内的代码在父进程代码运行完毕后就没有存在的意义了,就应该 将该子进程设置为守护进程,会在父进程代码结束后死掉 1234567891011121314151617181920212223from multiprocessing import Processimport timedef foo(): print(123) time.sle ...

git命令详解
git命令详解 自己的仓库管理: git add <filename> 将文件添加到暂存区中 (其中git add.可以将当前目录的子目录文件都添加到暂存区中) git commit -m "...": 保存仓库的历史记录,其中 -m "…"提交信息(概述) git config --global user.name "..."、git config --global user.email "...": 配置提交作者信息 git log: 查看提交日志(当前状态为终点) 会产生版本库 ...

Openmv使用
Openmv使用 下载Openmv IDE Openmv官网 中国代理——星瞳 Github_release 推荐下载星瞳的,这个是中文版的,并且其他两个下载非常慢。 Demo例程: openmv虽然比较贵,但是它的功能非常强大,已经提供了相当多的例程了。具体例程可以去星瞳的官网上查看,说明非常详细。 在此,我只介绍点我们这次需要用到的功能。 我使用的是OPENMV-H7 R1,芯片是STM32H743,镜头为IR 1080P 2.8mm Hello World 1234567891011121314151617# Hello World Example## Welcome to ...

深度学习
深度学习——神经网络 构建网络的总原则 一、增大网络容量,直到过拟命 二、采取措施抑制过拟合 三、继续增大网络容量,直到过拟合 线性回归 1234567891011121314151617181920212223242526272829303132333435363738# -*- coding: utf-8 -*-# Commented out IPython magic to ensure Python compatibility.import kerasimport numpy as npimport matplotlib.pyplot as plt# %matplotlib in ...

TD-afterstate
TD-afterstate afterstae: 当前执行一个动作后的状态,可以理解为中间态 是处理问题的一个改动,一种思想 以俄罗斯方块为例: 状态是由当前的局面和一个随机方块组成,执行一个下落动作之后会产生一个局面就称为afterstate,即动作结束后不能进行新的动作(没有新方块)的状态。 中间态和下一个随机方块构成了下一个状态 对于没有这种随机性的问题,afterstate就是next state td做预测,afterstate做控制 更多: 强化学习经典入门书的读书笔记系列–第六篇Temporal-Difference

Github下载、访问慢解决方法[转]
Github下载、访问慢解决方法[转] 下载tensorflow就16KiB/s,改完后能有900+KiB/s 修改hosts 1234567891011121314151617151.101.44.249 github.global.ssl.fastly.net192.30.253.113 github.com103.245.222.133 assets-cdn.github.com23.235.47.133 assets-cdn.github.com203.208.39.104 assets-cdn.github.com204.232.175.78 documentcloud.git ...

同性交友网站Github的骚操作
同性交友网站Github的骚操作 单击列表 当提Issue的时候,总会贴很长的代码,有没有什么办法美观一点呢,方法如下 12345<details><summary>Content of debug log</summary><pre>Paste content here ...</pre></details> 效果如下 Copy README Q:别人的REAMDE都那么炫酷,怎么办呢? A:点击他人的README.md文件,然后显示Raw就能看到html辣,由于markdown语法是支持嵌入html,因此只要把 ...

Python random
Python random 老是忘记random中每个函数之间的区别,而且常常跟numpy里的random也经常搞混,因此还是写篇文章记一下吧。 random模块 choice和sample python中random.choice()可以从给定的可迭代对象中随机挑选出一个。 而python中random.sample()方法则可以随机地从给定的可迭代对象中提取出N个不同的元素,列表的维数没有限制。(即第二参数给出个数N) 1234567891011import randomprint(random.sample([chr(97 + x) for x in range(int(9)) ...

numpy使用记录
Numpy使用记录 numpy中的random numpy.random.choice(a, size=None, replace=True, p=None) a : 如果是一维数组,就表示从这个一维数组中随机采样;如果是int型,就表示从0到a-1这个序列中随机采样。 size : 采样结果的数量,默认为1.可以是整数,表示要采样的数量;也可以为tuple,如(m, n, k),则要采样的数量为m * n * k,size为(m, n, k) replace : boolean型,采样的样本是否要更换?这个地方我不太理解,测了一下发现replace指定为True时,采样的元素会有重复; ...

Linux安装selenium执行Python程序
Linux安装selenium执行Python程序 配置python运行环境 安装selenium,sudo pip install selenium 安装chrome 提供下载网站chromedownloads 1234567891011$ sudo apt-get install libxss1 libappindicator1 libindicator7$ sudo dpkg -i google-chrome-stable_current_amd64-75.0.3770.80.deb # 执行sudo dpkg -i google-chrome*.deb后报错的话,那就 ...

常用域名记录解释
常用域名记录解释 A记录 A记录是用来创建到IP地址的记录。 A记录设置技巧 1、如果想创建不带www的记录,即ezloo.com,在主机记录中填写@或者留空,不同的注册商可能不一样。 2、创建多个域名到同一个IP,比如给博客建了二级域名,可以使用*.blog.ezloo.com来指向一个IP,这样的话,不管是访问a.blog.ezloo.com还是b.blog.ezloo.com都能到同一个IP。 3、如果你给同一个二级域名设置了多个A记录,比如你建了两个blog的A记录,其中一个指向了111.111.111.111,另一个指向了111.111.111.112,那么在查询的时候,每次返回 ...

Spring Boot学习笔记
Spring Boot hello word 第一个controller 12345678910111213141516171819202122232425262728/** * Project Name:demo * File Name:HelloController.java * Package Name:com.example.demo * Date:2019年9月15日下午8:27:56 * Copyright (c) 2019, chenzhou1025@126.com All Rights Reserved. * */ package com.example.de ...

软件测试大赛
软件测试大赛 初学流程 首先了解比赛,查看帮助文档平台帮助 然后在工具下载中下载工具、eclipse插件 最后根据教程中将插件安装好即可 移动应用测试开发 环境配置 配置Java环境 略,见Java 开发环境配置_菜鸟教程 安装ADB 1.菜单——>Tools——>Settings,将Server地址为 mirrors.neusoft.edu.cn, 端口 80 ,并且在Others里勾选 Force https://…,最后一定要选择菜单——>Packages菜单——>Reload 注:其他可用的镜像 2.把 Android SDK 路径下的tools ...

打jar包和使用jar包
打jar包和使用jar包 一、为什么要打jar包 给别人用的时候一般给别人的是class文件。如果有很多类这么办?把类变成一个压缩包!windows下的压缩包是.zip格式等,而eclipse压缩包是.jar格式。 二、如何查看jar包 用解压缩软件解压即可。可以看到里面有哪些class文件。 三、如何开发jar包 开发jar包的人员开发流程: 步骤1:编写类 12345678//GetSum.javapackage cn.itcast.sum;public class GetSum{      public static getSum(int a,int b){ ...

如何成为一位老司机——考驾照经历
如何成为一位老司机——考驾照经历 大一下报的名,几经转折,终于在2019-9-12,中秋放假前一天拿到了本本。 科一理论考试 太久远了,已经忘记了… 科二 训练 倒车入库: 左边小镜子底座盖过黄线,向左打死。 正手倒车时,靠近左边直角距离3个手指回正,然后看左边镜子出现直角,然后。 左手是一到二指头。 ▲入库重在自己调整,记住准则:左右镜子,哪边空隙大,方向盘往哪边打 小四项: 直角转弯: 人在路中间,直角重合于车窗黑线后向左打死。 S弯道: 确保人在路中间,可以略微偏左。左边小镜子底座压住右边黄线。方向盘一圈右手放在2点方向。如果黄线偏下,那么往1点方向调整,否则往3点 ...

Java自动化构建工具——Maven
Java自动化构建工具——Maven 目前的技术在开发中存在的问题、Maven作用 ①一个项目就是一个工程 如果项目非常庞大,就不适合继续使用package来划分模块。最好是每一个模块对应一个工程,利于分工协作。 △借助于Maven就可以将一个项目拆分成多个工程。 ②项目中需要的jar包必须手动“复制”、“粘贴”到WEB-INF/lib目录下 带来的问题是:同样的jar包文件重复出现在不同的项目工程中,一方面浪费存储空间,另外也让工程比较臃肿。 △借助Maven,可以将jar包仅仅保存在“仓库”中,有需要使用的工程“引用”这个文件接口,并不需要真的把jar包复制过来。 ③jar包需 ...