LabDoc | 晓兵实验

DataX 同步数据

2022.10.29 in Ju4t

DataX 是阿里云 DataWorks数据集成的开源版本，在阿里巴巴集团内被广泛使用的离线数据同步工具/平台。DataX 实现了包括 MySQL、Oracle、OceanBase、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、MaxCompute(ODPS)、Hologres、DRDS 等各种异构数据源之间高效的数据同步功能。下载地址 https://gitee.com/mirrors/DataX https://datax-opensource.oss-cn-hangzhou.aliyuncs.com/datax.tar.

更多

Flask Dockerfile

2022.10.21 in Ju4t

Dockerfile FROM python:3.7-alpine WORKDIR /code ENV FLASK_APP app.py ENV FLASK_RUN_HOST 0.0.0.0 RUN apk add --no-cache gcc musl-dev linux-headers COPY requirements.txt requirements.txt RUN pip install -r requirements.txt COPY . . CMD ["flask", "run"] Flask app.py import time im

更多

Docker Compose

2022.10.21 in Ju4t

Compose 是用于定义和运行多容器 Docker 应用程序的工具。通过 Compose，您可以使用 YML 文件来配置应用程序需要的所有服务。然后，使用一个命令，就可以从 YML 文件配置中创建并启动所有服务。 docker-compose.yml version: "3.8" services: django: build: context: . dockerfile: Dockerfile # target: dev command: python manage.py runserver 0.0.0.0:8000

更多

SparkStreaming Kafka

2022.10.17 in Ju4t

package com.ju4t.bigdata.spark.streaming import org.apache.kafka.clients.consumer.ConsumerConfig import org.apache.spark.SparkConf import org.apache.spark.storage.StorageLevel import org.apache.spark.streaming.kafka010.{ConsumerStrategies, KafkaUtils, LocationStrategies} import org.apache.spark.str

更多

SparkSQL Hive

2022.10.17 in Ju4t

package com.ju4t.bigdata.spark.sql import org.apache.spark.SparkConf import org.apache.spark.sql.SparkSession object Spark_SparkSQL_HIVE { def main(args: Array[String]): Unit = { // TODO 创建SparkSQL的运行环境 // 如果出现没有权限的话，加上如下内容 // System.setProperty("HADOOP_USER_NAME", "

更多

Spark wordcount Java版

2022.10.17 in Ju4t

完整版 package com.ju4t.bigdata.spark.core.wc import org.apache.spark.rdd.RDD import org.apache.spark.{SparkConf, SparkContext} object Spark_WordCount { def main(args: Array[String]): Unit = { // Application // Spark框架 // TODO 建立和Spark框架的连接 // JDBC : Connection val sparkConf = n

更多

Spark wordcount Python版

2022.10.12 in Ju4t

main.py from pyspark import SparkConf, SparkContext def wordcount(input="dataset/word.txt"): """ wordCount :param input: :return: """ # lines = sc.textFile(input) # word = lines.flatMap(lambda line: line.split(" "))

更多

Kubernetes DevOps: Jenkins Pipeline (流水线)

2022.10.12 in Ju4t

Jenkinsfile pipeline { agent none stages { stage('Clone Code') { agent { label 'master' } steps { echo "1.Git Clone Code" git url: "https://code.aliyun.com/Ju4t/helloword-springboot.git

更多

SpringCloud Dockerfile

2022.10.12 in Ju4t

dockerfile FROM java:8-jre MAINTAINER xiaobing <Ju4t@qq.com> VOLUME /tmp ADD web-0.0.1-SNAPSHOT.jar app.jar RUN bash -c 'touch /app.jar' ENV APP_OPTS="" ENTRYPOINT ["sh","-c","java -Djava.security.egd=file:/dev/./urandom -jar /app.jar $APP_OPTS"] EXPOS

更多

kubectl 镜像 Dockerfile

2022.10.12 in Ju4t

构建 kubectl docker 镜像什么是kubectl Kubectl 是 Kubernetes 命令行界面。它允许通过提供广泛的命令来管理 Kubernetes 集群，这些命令允许以友好的方式与 Kubernetes API 进行通信。 Dockerfile FROM alpine:3.8 LABEL maintainer="敬晓兵 <Ju4t@qq.com>" ARG KUBE_VERSION="v1.23.5" RUN apk add --update ca-certificates \ && apk a

更多