Data Science Notes
Intro
This is going to be a place where I (slowly) update my data science notes to keep my memory refreshed. I’ve created another Github reporsitory chnynf/data-science-notes to host this markdown file and use Github Actions to automatically push the md file to this post. I’ll be glad if anyone can contribute together to the notes. Most of the snippets here will be the ones I pick up from the internet, from me and my friend’s notes, and from the book All of Statistics: A Concise Course in Statistical Inference, from Larry A. Wasserman.
Random Variables
A random variable is a mapping that assigns a real number X(ω) to each outcome ω.
Some important discrete random variables
The Point Mass Distribution:
The Discrete Uniform Distribution:
The Bernoulli Distribution:
§
The probability function is:
The Binomial Distribution:
Flip the coin n times and let X be the number of heads, then
§
The probability function is:
(Sum of binomials are also binomials.)
The Geometric
Hexo 建站
最近几天研究了Hexo静态博客。有几个目标:
第一是借此熟悉一下前端的知识,HTML,CSS,Javascript。
第二是在AdTech领域的后台做了这么多年的DS,想用这个网站试试publisher前台的各种工具。
第三是因为过去一直想比较全面的整理一下数据科学的知识点,希望可以放在这里。
最后是希望偶尔写写笔记,记录一下玩了点啥,去了哪,试了什么玩意。回头可以看看。
中途也考虑过用Next.js从头开始写一个网站,不过要写出一个功能齐全的博客好像要花挺多功夫,我毕竟不是搞前端的。也没有选择用Wordpress,因为即便有这么一个功能齐全的博客,目前也不想花钱租个后台服务器。
最后用了Hexo,作为一个静态博客,可以直接host在Github Pages上。网上都说它的缺点在于更新博客比较麻烦,需要跟着电脑走。我使用了一个叫Gitpod的服务,它可以和Github无缝连接,相当于给每个Repo准备一个远程Container作为开发环境,每个月可以免费使用50小时,无论在哪只要有浏览器,打开就能直接写代码掉头发。Github自己也在准备类似Gitpod的服务,叫Github Codespaces,但是内测了大概有一年多,我一直没等到。另外deploy的部分,Github Pages也似乎解决的很好。有这两个免费服务,我甚至没有在本地安装Node.js,所以目前没有体验到困难。也不排除我中间忽略了什么操作。
前几天时间主要花在了网站外观上,一方面因为我其实思维贫乏没有什么博客可写,另一方面我本来就想看看前端。尝试了在很多主题上修改,试了NexT,icalm,,butterfly。这几个都不错,但是有的比较复杂,有的不太符合我要求。Butterfly这个主题很不错,但是它写template用到了pug,为了控制时间成本,我就不去了解了。最后选择了这个Ocean,非常喜欢它有一个首页视频,但是我做了些改动,把视频换成了图片并加上了dombrant弄的blurry image load功能,这样首页load的比较快。
Hello World
You’re funny.