跳至主要內容
速成lua

提示

转载自https://learnxinyminutes.com/

-- 单行注释以两个连字符开头

--[[
     多行注释
--]]

----------------------------------------------------
-- 1. 变量和流程控制
----------------------------------------------------

num = 42  -- 所有的数字都是双精度浮点型。
-- 别害怕,64位的双精度浮点型数字中有52位用于
-- 保存精确的整型值; 对于52位以内的整型值,
-- 不用担心精度问题。

s = 'walternate'  -- 和Python一样,字符串不可变。
t = "也可以用双引号"
u = [[ 多行的字符串
       以两个方括号
       开始和结尾。]]
t = nil  -- 撤销t的定义; Lua 支持垃圾回收。

-- 块使用do/end之类的关键字标识:
while num < 50 do
  num = num + 1  -- 不支持 ++ 或 += 运算符。
end

-- If语句:
if num > 40 then
  print('over 40')
elseif s ~= 'walternate' then  -- ~= 表示不等于。
  -- 像Python一样,用 == 检查是否相等 ;字符串同样适用。
  io.write('not over 40\n')  -- 默认标准输出。
else
  -- 默认全局变量。
  thisIsGlobal = 5  -- 通常使用驼峰。

  -- 如何定义局部变量:
  local line = io.read()  -- 读取标准输入的下一行。

  -- ..操作符用于连接字符串:
  print('Winter is coming, ' .. line)
end

-- 未定义的变量返回nil。
-- 这不是错误:
foo = anUnknownVariable  -- 现在 foo = nil.

aBoolValue = false

--只有nil和false为假; 0和 ''均为真!
if not aBoolValue then print('false') end

-- 'or'和 'and'短路
-- 类似于C/js里的 a?b:c 操作符:
ans = aBoolValue and 'yes' or 'no'  --> 'no'

karlSum = 0
for i = 1, 100 do  -- 范围包含两端
  karlSum = karlSum + i
end

-- 使用 "100, 1, -1" 表示递减的范围:
fredSum = 0
for j = 100, 1, -1 do fredSum = fredSum + j end

-- 通常,范围表达式为begin, end[, step].

-- 循环的另一种结构:
repeat
  print('the way of the future')
  num = num - 1
until num == 0

----------------------------------------------------
-- 2. 函数。
----------------------------------------------------

function fib(n)
  if n < 2 then return n end
  return fib(n - 2) + fib(n - 1)
end

-- 支持闭包及匿名函数:
function adder(x)
  -- 调用adder时,会创建返回的函数,
  -- 并且会记住x的值:
  return function (y) return x + y end
end
a1 = adder(9)
a2 = adder(36)
print(a1(16))  --> 25
print(a2(64))  --> 100

-- 返回值、函数调用和赋值都可以
-- 使用长度不匹配的list。
-- 不匹配的接收方会被赋值nil;
-- 不匹配的发送方会被丢弃。

x, y, z = 1, 2, 3, 4
-- x = 1、y = 2、z = 3, 而 4 会被丢弃。

function bar(a, b, c)
  print(a, b, c)
  return 4, 8, 15, 16, 23, 42
end

x, y = bar('zaphod')  --> 打印 "zaphod  nil nil"
-- 现在 x = 4, y = 8, 而值15..42被丢弃。

-- 函数是一等公民,可以是局部的,也可以是全局的。
-- 以下表达式等价:
function f(x) return x * x end
f = function (x) return x * x end

-- 这些也是等价的:
local function g(x) return math.sin(x) end
local g; g = function (x) return math.sin(x) end
-- 以上均因'local g',使得g可以自引用。
local g = function(x) return math.sin(x) end
-- 等价于 local function g(x)..., 但函数体中g不可自引用

-- 顺便提下,三角函数以弧度为单位。

-- 用一个字符串参数调用函数,可以省略括号:
print 'hello'  --可以工作。

-- 调用函数时,如果只有一个table参数,
-- 同样可以省略括号(table详情见下):
print {} -- 一样可以工作。

----------------------------------------------------
-- 3. Table。
----------------------------------------------------

-- Table = Lua唯一的组合数据结构;
--         它们是关联数组。
-- 类似于PHP的数组或者js的对象,
-- 它们是哈希表或者字典,也可以当列表使用。

-- 按字典/map的方式使用Table:

-- Dict字面量默认使用字符串类型的key:
t = {key1 = 'value1', key2 = false}

-- 字符串key可以使用类似js的点标记:
print(t.key1)  -- 打印 'value1'.
t.newKey = {}  -- 添加新的键值对。
t.key2 = nil   -- 从table删除 key2。

-- 使用任何非nil的值作为key:
u = {['@!#'] = 'qbert', [{}] = 1729, [6.28] = 'tau'}
print(u[6.28])  -- 打印 "tau"

-- 数字和字符串的key按值匹配的
-- table按id匹配。
a = u['@!#']  -- 现在 a = 'qbert'.
b = u[{}]     -- 我们或许期待的是 1729,  但是得到的是nil:
-- b = nil ,因为没有找到。
-- 之所以没找到,是因为我们用的key与保存数据时用的不是同
-- 一个对象。
-- 所以字符串和数字是移植性更好的key。

-- 只需要一个table参数的函数调用不需要括号:
function h(x) print(x.key1) end
h{key1 = 'Sonmi~451'}  -- 打印'Sonmi~451'.

for key, val in pairs(u) do  -- 遍历Table
  print(key, val)
end

-- _G 是一个特殊的table,用于保存所有的全局变量
print(_G['_G'] == _G)  -- 打印'true'.

-- 按列表/数组的方式使用:

-- 列表字面量隐式添加整数键:
v = {'value1', 'value2', 1.21, 'gigawatts'}
for i = 1, #v do  -- #v 是列表的大小
  print(v[i])  -- 索引从 1 开始!! 太疯狂了!
end
-- 'list'并非真正的类型,v 其实是一个table,
-- 只不过它用连续的整数作为key,可以像list那样去使用。

----------------------------------------------------
-- 3.1 元表(metatable) 和元方法(metamethod)。
----------------------------------------------------

-- table的元表提供了一种机制,支持类似操作符重载的行为。
-- 稍后我们会看到元表如何支持类似js prototype的行为。

f1 = {a = 1, b = 2}  -- 表示一个分数 a/b.
f2 = {a = 2, b = 3}

-- 这会失败:
-- s = f1 + f2

metafraction = {}
function metafraction.__add(f1, f2)
  local sum = {}
  sum.b = f1.b * f2.b
  sum.a = f1.a * f2.b + f2.a * f1.b
  return sum
end

setmetatable(f1, metafraction)
setmetatable(f2, metafraction)

s = f1 + f2  -- 调用在f1的元表上的__add(f1, f2) 方法

-- f1, f2 没有关于元表的key,这点和js的prototype不一样。
-- 因此你必须用getmetatable(f1)获取元表。
-- 元表是一个普通的table,
-- 元表的key是普通的Lua中的key,例如__add。

-- 但是下面一行代码会失败,因为s没有元表:
-- t = s + s
-- 下面提供的与类相似的模式可以解决这个问题:

-- 元表的__index 可以重载用于查找的点操作符:
defaultFavs = {animal = 'gru', food = 'donuts'}
myFavs = {food = 'pizza'}
setmetatable(myFavs, {__index = defaultFavs})
eatenBy = myFavs.animal  -- 可以工作!感谢元表

-- 如果在table中直接查找key失败,会使用
-- 元表的__index 递归地重试。

-- __index的值也可以是function(tbl, key)
-- 这样可以支持自定义查找。

-- __index、__add等的值,被称为元方法。
-- 这里是一个table元方法的清单:

-- __add(a, b)                     for a + b
-- __sub(a, b)                     for a - b
-- __mul(a, b)                     for a * b
-- __div(a, b)                     for a / b
-- __mod(a, b)                     for a % b
-- __pow(a, b)                     for a ^ b
-- __unm(a)                        for -a
-- __concat(a, b)                  for a .. b
-- __len(a)                        for #a
-- __eq(a, b)                      for a == b
-- __lt(a, b)                      for a < b
-- __le(a, b)                      for a <= b
-- __index(a, b)  <fn or a table>  for a.b
-- __newindex(a, b, c)             for a.b = c
-- __call(a, ...)                  for a(...)

----------------------------------------------------
-- 3.2 与类相似的table和继承。
----------------------------------------------------

-- Lua没有内建的类;可以通过不同的方法,利用表和元表
-- 来实现类。

-- 下面是一个例子,解释在后面:

Dog = {}                                   -- 1.

function Dog:new()                         -- 2.
  local newObj = {sound = 'woof'}                -- 3.
  self.__index = self                      -- 4.
  return setmetatable(newObj, self)        -- 5.
end

function Dog:makeSound()                   -- 6.
  print('I say ' .. self.sound)
end

mrDog = Dog:new()                          -- 7.
mrDog:makeSound()  -- 'I say woof'         -- 8.

-- 1. Dog看上去像一个类;其实它是一个table。
-- 2. 函数tablename:fn(...) 等价于
--    函数tablename.fn(self, ...)
--    冒号(:)只是添加了self作为第一个参数。
--    阅读7 & 8条 了解self变量是如何得到其值的。
-- 3. newObj是类Dog的一个实例。
-- 4. self = 被继承的类。通常self = Dog,不过继承可以改变它。
--    如果把newObj的元表和__index都设置为self,
--    newObj就可以得到self的函数。
-- 5. 备忘:setmetatable返回其第一个参数。
-- 6. 冒号(:)的作用和第2条一样,不过这里
--    self是一个实例,而不是类
-- 7. 等价于Dog.new(Dog),所以在new()中,self = Dog。
-- 8. 等价于mrDog.makeSound(mrDog); self = mrDog。

----------------------------------------------------

-- 继承的例子:

LoudDog = Dog:new()                           -- 1.

function LoudDog:makeSound()
  local s = self.sound .. ' '                       -- 2.
  print(s .. s .. s)
end

seymour = LoudDog:new()                       -- 3.
seymour:makeSound()  -- 'woof woof woof'      -- 4.

-- 1. LoudDog获得Dog的方法和变量列表。
-- 2. 因为new()的缘故,self拥有了一个'sound' key,参见第3条。
-- 3. 等价于LoudDog.new(LoudDog),转换一下就是
--    Dog.new(LoudDog),这是因为LoudDog没有'new' key,
--    但是它的元表中有 __index = Dog。
--    结果: seymour的元表是LoudDog,并且
--    LoudDog.__index = Dog。所以有seymour.key
--    = seymour.key, LoudDog.key, Dog.key
--    从其中第一个有指定key的table获取。
-- 4. 在LoudDog可以找到'makeSound'的key;
--    等价于LoudDog.makeSound(seymour)。

-- 如果有必要,子类也可以有new(),与基类相似:
function LoudDog:new()
  local newObj = {}
  -- 初始化newObj
  self.__index = self
  return setmetatable(newObj, self)
end

----------------------------------------------------
-- 4. 模块
----------------------------------------------------


--[[ 我把这部分给注释了,这样脚本剩下的部分可以运行

-- 假设文件mod.lua的内容类似这样:
local M = {}

local function sayMyName()
  print('Hrunkner')
end

function M.sayHello()
  print('Why hello there')
  sayMyName()
end

return M

-- 另一个文件可以使用mod.lua的功能:
local mod = require('mod')  -- 运行文件mod.lua.
-- 注意:require 需要配合 LUA_PATH 一起使用 例如:export LUA_PATH="$HOME/workspace/projectName/?.lua;;"

-- require是包含模块的标准做法。
-- require等价于:     (针对没有被缓存的情况;参见后面的内容)
local mod = (function ()
  <contents of mod.lua>
end)()
-- mod.lua被包在一个函数体中,因此mod.lua的局部变量
-- 对外不可见。

-- 下面的代码可以工作,因为在这里mod = mod.lua 中的 M:
mod.sayHello()  -- Says hello to Hrunkner.

-- 这是错误的;sayMyName只在mod.lua中存在:
mod.sayMyName()  -- 错误

-- require返回的值会被缓存,所以一个文件只会被运行一次,
-- 即使它被require了多次。

-- 假设mod2.lua包含代码"print('Hi!')"。
local a = require('mod2')  -- 打印Hi!
local b = require('mod2')  -- 不再打印; a=b.

-- dofile与require类似,但是不缓存:
dofile('mod2')  --> Hi!
dofile('mod2')  --> Hi! (再次运行,与require不同)

-- loadfile加载一个lua文件,但是并不运行它。
f = loadfile('mod2')  -- Calling f() runs mod2.lua.

-- loadstring是loadfile的字符串版本。
-- (loadstring已弃用, 使用load代替)
g = load('print(343)')  --返回一个函数。
g()  -- 打印343; 在此之前什么也不打印。

--]]

Genhiy...大约 8 分钟Codinglua
SQL分位数计算优化

介绍

在做数据分析或者门户看板的时候,我们有时会有求大盘数据的分位数的需求,大部分场景在都可以通过Hive提供的分位数函数求解,但是在大数据量(几十亿+)的情况下,HIVE自带的分位数函数往往执行速度受限,极端情况需要需要执行十几小时或者在资源限制下得不到最终结果。

本文介绍几种方式,通过对sql的简单改造,更加快速执行出结果。

案例

案例一:计算过去30天内用户对主播的时长分(double类型的小数)10,25, 50,75,90分位数

案例背景:某时长优化实验需要确定策略阈值,因此需要探查下满足某个特征的用户群体对某类主播的时长分的分位数情况,以便对该人群的直播喜好属性做更精细化的划分


Genhiy...大约 6 分钟CodingSQL
Hadoop分布式计算

Hadoop

Hadoop 是一个开源的分布式计算框架,由 Apache Software Foundation 开发和维护。它主要用于处理和分析大数据。

什么是Hadoop?

Hadoop 是一个开源的分布式计算框架,由 Apache Software Foundation 开发和维护。它主要用于处理和分析大数据。Hadoop 的核心设计理念是将计算任务分布到多个节点上,以实现高度可扩展性和容错性。


Genhiy...大约 20 分钟CodingHadoop
SQL学习笔记

有了大语言模型之后,学习和应用一个陌生的代码框架真的容易了太多,这样算法工程师就可以把更多心思放在如何设计算法上,用我个人今天的经验举个例子:

简单应用

下午15点左右,接到了一个任务,有一个数据库,其中关键信息为uid、aid、ts,分别为user用户id、author作者id、timestamp时间戳,需求:1.只保留一个ts下的数据,2.相同的(uid,aid)对,只保留一条数据。在此之前我没接触过SQL,但是,通过kimi:

任务一:筛选

提示

Prompt:写一段sql语句,用于从一个表格中读取ts列以及新的一列rk,rk列内容为ts从小到大排列的位次。


Genhiy...大约 6 分钟CodingSQL
Redis数据库

基本信息

REmote DIctionary Server(Redis) 是一个由Salvatore Sanfilippo写的key-value存储系统。

Redis是一个开源的使用ANSI C语言编写、遵守BSD协议、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库,并提供多种语言的API。

它通常被称为数据结构服务器,因为值(value)可以是 字符串(String), 哈希(Map), 列表(list), 集合(sets) 和 有序集合(sorted sets)等类型。

Redis 与其他 key - value 缓存产品有以下三个特点:


Genhiy...大约 2 分钟CodingRedis
shell脚本基本语法

提示

主要内容可以参考:一文掌握shell脚本的基本语法,本文仅作以补充。

基础内容

  • shell脚本都是以#!开头,告知系统该文件的执行需要一个解释器。 一般是#!/bin/sh#!/bin/bash
  • 执行脚本:sh helloworld.sh或者bash helloworld.sh
  • echo:Shell 的 echo 指令与 PHP 的 echo 指令类似,都是用于字符串的输出。注意,字符串可以不加双引号直接跟在echo后面。echo -n 表示不换行输出。显示日期:echo `date`。
  • read:从标准输入中读取一行,并把输入行的每个字段的值指定给 shell 变量。
  • 自变量命名:变量名=变量值,等号两侧不能有空格(与其它语言可设空格的区别之处)。变量名一般习惯使用大写。使用变量:$变量名。

Genhiy...大约 2 分钟CodingShell
linux文件处理操作

基础linux文件处理操作

  • cd:change directory,改变工作目录:“..”代表当前目录的上一级目录,“.”则代表当前目录,“~”代表用户主目录。
  • 相对目录与绝对目录:相对目录:在输入路径时,最前面的不是/或,表示相对当前目录所在的目录;绝对目录:在输入路径时,最前面的是/或
  • pwd:print work directory,显示当前工作目录的绝对路径
  • mkdir:make directory,mkdir test:创建新的文件夹test
  • ls:list,列出目录的全部内容:ls -a 显示当前目录中所有文件,包含隐藏文件;ls -l 以列表方式显示文件的详细信息;ls -h 配合ls以人性化的方式显示文件大小。
    • ls通配符:*代表任意个数字符,?代表任意一个字符,[]匹配字符组中的任意一个,[a,b,c]匹配abc中的任意一个,[a-f]匹配a-f范围内任意一个。
    • ls通配符使用:ls 1*a?.txt:意思是会匹配出如123af.txt和1ad.txt之类的文件。
  • touch:如果文件不存在,则创建新的文件;如果文件存在,则修改文件的修改日期
  • mv:move,移动文件,也可给文件或目录重命名:mv test_file ../test,也可以重命名:mv 1.py 2.py
  • cp:copy,复制文件:移动文件到链接下:cp file.txt /path/to/destination/
    • 移动文件到链接下并重命名:cp file.txt /path/to/destination/file2.txt
    • 不复制文件,只生成链接文件:cp -i file.txt /path/to/destination/
  • rm:remove,删除文件或文件夹,不能恢复。-f:强制删除,忽略不存在的文件,-r:递归地删除目录下的内容,删除文件夹时必须加此参数
  • sudo:substitute user do用于提升用户权限,以管理员方式运行
  • tree:tree,以树状图列出文件目录结构
  • 解压文件:unzip -o x.zip -d ./x # -o指不必先询问用户,unzip执行后覆盖原有文件。
  • 软连接:ln -s 源文件 目标文件:ln –s /var/www/test /var/test
    • 修改指向的新路径:ln –snf /var/www/test1 /var/test
    • 删除软连接:unlink test;其次用法:rm test
    • 不建议用法:rm -rf test:不推荐使用rm -rf,在使用rm -rf删除时,如果链接目标是目录时千万要小心,使用 rm -rf test/ 时你会发现,软连接并没有被删除,而源目录下的文件会被删除!
  • C++编译器安装:sudo apt-get install g++

Genhiy...大约 3 分钟CodingLinux