背景:terraform 项目中有些任务需要定期执行,但job 流水线作业资源与进程强绑定关系,进程间需要互斥,避免多个进程同时操作
- 例如:1点执行脚本后 1点05分脚本还没有退出,如果是每2分钟启动的定时任务,那么就会有冲突。
#Kubernetes #Docker #golang
背景:terraform 项目中有些任务需要定期执行,但job 流水线作业资源与进程强绑定关系,进程间需要互斥,避免多个进程同时操作
监控系统的历史悠久,是一个很成熟的方向,而 Prometheus 作为新生代的开源监控系统,慢慢成为了云原生体系的事实标准,也证明了其设计很受欢迎。本文主要分享在 Prometheus 实践中遇到的一些问题和思考。
背景:gitlab-runner注册为shell executer时执行shell,默认使用的是sh,但shell执行需要安装nodejs,而nodejs 是通过nvm实现版本控制,初始化过程就是在bash下面执行的,需要使用bash,比如使用source命令,所以需要将默认shell指定为bash。
不知道为什么,可能也是人开始步入中年的的缘故(本人95),逐渐开始比较关注身心健康,原因之一就是自媒体时代信息爆炸,可以看到网上很多年纪轻轻就的了各种病包括癌症,不妨会考虑到自己是否也需要注意一下平时的饮食习惯,从超市的无脑看到喜欢就买转变到仔细认真看配料表,什么防腐剂 甜味剂啥的,都开始关注。最近油罐车拉运食用油的新闻被爆出,简直震惊,网友还调侃:”怪不得我炒菜冒火,原来是这个原因”…… 除了这些违规违法的食品安全问题我觉得这个只是一个案例,更多还有没有被曝光的我们压根就不知道,可想而知,食品安全的问题已经到了很严重的地步,与其说食品制造商为了谋取利润铤而走险不如说法律监管不到位,处罚太轻相当于就是在鼓励他们继续犯罪,所以我觉得食品安全问题应该引起国家重视,毕竟民以食为天,食品安全问题不解决,人民的健康就得不到保障,命都没了谈其他什么都是扯淡。
食品安全要想得到有效监管有效遏制,那”特供”就应该被废除,上层吃得都是原生态,底层吃什么才不管,表面上监管缺失实际上不影响到上层利益是不会根治的
背景: 需求:由于墙的关系,一些特殊apt包的源需要外网,服务是容器起的,所以构建docker镜像软件包需要翻墙,因此在构建服务器上起v2ray 代理端口监听0.0.0.0接口:端口
背景: 最近在使用openvpn 客户端,碍于无法直接在客户端之间访问其内部设备,进行了一些尝试,记录一下
背景: 最近在使用openvpn 客户端,发现后台运行的openvpn 客户端会出现输入密码的问题, 导致无法正常启动.后面查找文档,可以指定秘钥文件来运行,但是命令也有区别,其中启动命令取决于创建客户端时使用的是方式
背景: pycharm terminal 启动 长时间运行会导致pychram崩溃,导致服务挂掉,改进为start-job 命令发布后端服务
背景: A100机器是由docker 启动,,其中挂载的驱动会被dockerd 重启,导致挂载的驱动不能被正常运行,导致服务异常
背景: gitlab-runner cp命令在gitlab-runner 使用中尽量不要直接cp 全部文件到部署目录下, 如果当前仓库文件是官网首页,如果是nginx部署代理静态页面,那么 root指令设置的是部署目录,那么当前的目录有可能会直接访问到.git/config 文件
背景: 这个项目负责集群deployment根据第三方返回的负载指数来配置扩缩容,作用于火山引擎的VCI容器,实现了GPU服务器弹性伸缩,可以缓解高峰期服务压力,降低用户等待时间,提高用户体验
背景: 客户有一天反馈网页某个接口返回404, 排查了一下原因是因为istio ingressgateway 访问404, 因为接口调用的domain是属于外部集群,内部集群通过ServiceEntry访问不到, 但这个配置很久没有改动过, 排查了一下istio ingressgateway 的日志, 发现日志显示NR,一般NR状态为配置路由无法匹配触发的,根据以往的经验先看网关的配置
背景: 开发需要在提交merge时触发一个通知.展示一些特定信息,方便开发及时知道mr状态.按照以往的开源设计软件,直接找文档查看相关api
gitlab_webhook 事件样例: https://git.xkool.org/help/user/project/integrations/webhooks ,可以根据请求数据封装自定义信息总体思路:根据gitlab自带events事件,拿到请求数据再封装企业微信数据结构,然后构造webhook服务api,主要是在方法中实现请求企业微信机器人,到达通知目的
背景:最近因为服务器过期需要将旧的rabbitmq实例重新迁移,考虑到原有的rabbitmq是在一台2核4Gi内存的ecs上,然后计划容器化到k8s里面;在本地实践后没有问题直接上了测试集群,可能测试集群上测不到生产环境的应用场景导致上到生产环境出现ack timeout 的情况,因为之前没有接触到这种优化调优问题,因此记录一下.
需求: 最近公司新加入了很多新人,每个新人开发人员都需要一个openvpn账号才可以登入公司内网,按照之前的创建账号的效率肯定要累垮,所以考虑用自动化脚本自动创建,但是openvpn创建的过程是一个交互式过程, 需要在控制台输入用户名称,密码,别名,然后需要确认(Y/N),所以这些是这个自动化脚本的难点,但是方法总比困难多,下面是一个代码案例 首先第一步需要父进程bash: