Java分布式ID

1 什么是分布式ID

        分布式ID是指在分布式系统中生成的唯一标识符,用于标识不同实体或数据的唯一性。在分布式系统中,多台机器并行处理任务,为了确保生成的ID在整个系统中的唯一性,需要采用特殊的算法来生成分布式ID。

        在传统的单机系统中,可以使用自增序列或随机数来生成唯一ID。但在分布式系统中,多台机器同时生成ID时可能会导致重复的情况。为了解决这个问题,需要引入一种分布式ID生成算法,确保在整个分布式系统中生成的ID是唯一的。

        分布式ID的设计要考虑并发性能、全局唯一性和扩展性等因素,并根据具体的系统需求选择合适的算法实现。常见的分布式ID生成算法包括雪花算法(Snowflake)、UUID(Universally Unique Identifier)等。

2 UUID

        UUID(Universally Unique Identifier)是一种标识符,用于在计算系统中生成全局唯一的ID。它是由128位的二进制数表示,通常以32位的十六进制字符串形式展示。

        UUID的生成算法保证了在全球范围内生成的ID具有极高的唯一性。它不依赖于中央控制器或集中式的ID生成服务,可以在分布式系统中生成唯一的标识符。

        生成的UUID通常呈现为以下形式:

        xxxxxxxx-xxxx-Mxxx-Nxxx-xxxxxxxxxxxx

        其中,"x"表示十六进制数字。具体的格式和含义取决于UUID的版本和变体。

        UUID具有以下特点:

  • 全局唯一性:UUID的生成算法确保在全球范围内生成的ID具有极高的唯一性,不同系统和节点生成的UUID几乎不会重复。
  • 无序性:UUID是基于随机数或名称空间生成的,没有严格的递增或递减顺序。
  • 可用性:UUID生成算法简单高效,生成过程不需要依赖网络通信或中央服务器。

        UUID广泛应用于分布式系统、数据库、标识符生成等场景,用于唯一标识实体、数据记录或资源。它在保证全局唯一性的同时,提供了一种简单可靠的标识方案。

        在Java中,UUID类是用于生成和操作UUID的工具类,提供了方便的方法来生成和操作UUID。它可以用于在Java应用程序中生成唯一的标识符,例如在分布式系统中跟踪实体或记录的唯一标识。

        UUID类位于java.util包下,并提供了以下主要方法:

  • randomUUID(): 静态方法,用于生成一个随机的UUID。该方法会使用随机数生成算法生成一个符合UUID标准的随机UUID。
  • toString(): 将UUID对象转换为字符串表示。

        使用java生产一个UUID的代码示意如下:

UUID uuid = UUID.randomUUID();
String uuidString = uuid.toString();

        UUID的优势与劣势

        优势:

  • 全局唯一性:UUID的生成算法保证了生成的ID在全球范围内的唯一性,不依赖于中央控制器或集中式的ID生成服务。这意味着在分布式系统中不同节点生成的UUID不会发生冲突。
  • 无序性:UUID是基于随机数生成的,没有严格的递增或递减的顺序。这对于某些应用场景来说是有利的,因为它不会暴露数据生成的时间或其他敏感信息。
  • 简单易用:UUID的生成算法相对简单,生成过程高效,可以快速地生成ID。
  • 无需网络通信:生成UUID不需要依赖网络通信或中央服务器,每个节点可以独立生成ID,减少了系统的复杂性和对网络的依赖。

        劣势:

  • 长度较长:UUID通常由32位的十六进制数表示,加上分隔符的话长度更长。这会增加存储和传输的成本,特别是在大规模的数据集合中使用UUID作为标识符时。
  • 不可读性:UUID是由数字和字母组成的字符串,对人类来说不太友好,不易于直观理解。这在调试、日志记录和数据查询等场景中可能会带来一些困难。
  • 无法排序:由于UUID是基于随机数生成的,它们之间没有严格的顺序关系。这导致在某些需要按照时间或顺序访问数据的场景中,UUID并不适合作为排序依据。
  • 不适合作为数据库索引:由于UUID的无序性和长度较长,将UUID作为数据库的主键或索引可能会导致性能下降,尤其是在大规模数据集合和频繁的索引操作中。

3 雪花算法

        雪花算法(Snowflake Algorithm)是一种常用的分布式ID生成算法,最初由Twitter开发并广泛应用于分布式系统中。它的设计目标是生成全局唯一且有序递增的ID,适用于大规模分布式系统中的标识符需求。相对于UUID,雪花算法ID的好处是长度短并且还是有序递增的。

        雪花算法生成的ID是一个64位的长整型数值,具体格式如下所示:

0 | 0000000000 | 00000 | 00000 | 000000000000

        其中:最高位是未使用的符号位(为0),接下来的41位表示时间戳,然后是5位的数据中心标识符,5位的机器标识符,最后是12位的序列号。

        雪花算法生成ID的过程如下:

  • 时间戳:使用当前时间戳减去一个固定的起始时间(如2010年1月1日),得到一个相对时间。这样可以确保在一定时间内生成的ID具有递增的趋势。
  • 数据中心标识符和机器标识符:每个数据中心分配一个唯一的数据中心标识符,每台机器分配一个唯一的机器标识符。这样可以在分布式环境中唯一标识每个数据中心和每台机器。
  • 序列号:在同一毫秒内生成的ID,通过序列号来进行区分,保证同一机器在同一毫秒内生成的ID的唯一性。序列号从0开始,每生成一个ID自增1,最多可以达到12位的长度(即4096个序列号)。

        雪花算法的优点包括:

  • 全局唯一性:在分布式系统中,不同节点生成的ID不会产生冲突,确保全局唯一性。
  • 有序性:生成的ID在时间上有序递增,方便按照时间排序和索引。
  • 高性能:生成ID的算法简单高效,不依赖于网络通信或中央服务器。

        然而,雪花算法也有一些限制:

  • 依赖于系统时间:由于使用时间戳作为ID的一部分,系统时间的回拨或不同节点之间的时间差异可能会导致生成的ID不唯一或不按照预期顺序递增。
  • 数据中心和机器标识符的分配需要管理:为每个数据中心和机器分配唯一标识符需要一定的管理工作,确保标识符的唯一性。
  • 时钟回拨问题:如果系统时间发生回拨(校准调整时间),可能会导致生成的ID不唯一或不按照预期递增。

        在使用雪花算法时,需要根据具体应用的需求和场景,合理设置数据。

/**
 * 雪花算法
 */
public class SnowFlake {

    /** 开始时间截 (2020-01-01) */
    private final long twepoch = 1577808000000L;

    /** 机器id所占的位数 */
    private final long workerIdBits = 5L;

    /** 数据标识id所占的位数 */
    private final long dataCenterIdBits = 5L;

    /** 支持的最大机器id,结果是31 (这个移位算法可以很快的计算出几位二进制数所能表示的最大十进制数) */
    private final long maxWorkerId = -1L ^ (-1L << workerIdBits);

    /** 支持的最大数据标识id,结果是31 */
    private final long maxDataCenterId = -1L ^ (-1L << dataCenterIdBits);

    /** 序列在id中占的位数 */
    private final long sequenceBits = 12L;

    /** 机器ID向左移12位 */
    private final long workerIdShift = sequenceBits;

    /** 数据标识id向左移17位(12+5) */
    private final long dataCenterIdShift = sequenceBits + workerIdBits;

    /** 时间截向左移22位(5+5+12) */
    private final long timestampLeftShift = sequenceBits + workerIdBits + dataCenterIdBits;

    /** 生成序列的掩码,这里为4095 (0b111111111111=0xfff=4095) */
    private final long sequenceMask = -1L ^ (-1L << sequenceBits);

    /** 工作机器ID(0~31) */
    private long workerId;

    /** 数据中心ID(0~31) */
    private long dataCenterId;

    /** 毫秒内序列(0~4095) */
    private long sequence = 0L;

    /** 上次生成ID的时间截 */
    private long lastTimestamp = -1L;

    private static SnowFlake idWorker;

    static {
        idWorker = new SnowFlake(getWorkId(),getDataCenterId());
    }

    //==============================Constructors=====================================
    /**
     * 构造函数
     * @param workerId 工作ID (0~31)
     * @param dataCenterId 数据中心ID (0~31)
     */
    public SnowFlake(long workerId, long dataCenterId) {
        if (workerId > maxWorkerId || workerId < 0) {
            throw new IllegalArgumentException(String.format("workerId can't be greater than %d or less than 0", maxWorkerId));
        }
        if (dataCenterId > maxDataCenterId || dataCenterId < 0) {
            throw new IllegalArgumentException(String.format("dataCenterId can't be greater than %d or less than 0", maxDataCenterId));
        }
        this.workerId = workerId;
        this.dataCenterId = dataCenterId;
    }

    // =====================Methods=======================
    /**
     * 获得下一个ID (该方法是线程安全的)
     * @return SnowflakeId
     */
    public synchronized long nextId() {
        long timestamp = timeGen();

        //如果当前时间小于上一次ID生成的时间戳,说明系统时钟回退过这个时候应当抛出异常
        if (timestamp < lastTimestamp) {
            throw new RuntimeException(
                    String.format("Clock moved backwards.  Refusing to generate id for %d milliseconds", lastTimestamp - timestamp));
        }

        //如果是同一时间生成的,则进行毫秒内序列
        if (lastTimestamp == timestamp) {
            sequence = (sequence + 1) & sequenceMask;
            //毫秒内序列溢出
            if (sequence == 0) {
                //阻塞到下一个毫秒,获得新的时间戳
                timestamp = tilNextMillis(lastTimestamp);
            }
        }
        //时间戳改变,毫秒内序列重置
        else {
            sequence = 0L;
        }

        //上次生成ID的时间截
        lastTimestamp = timestamp;

        //移位并通过或运算拼到一起组成64位的ID
        return ((timestamp - twepoch) << timestampLeftShift)
                | (dataCenterId << dataCenterIdShift)
                | (workerId << workerIdShift)
                | sequence;
    }

    /**
     * 阻塞到下一个毫秒,直到获得新的时间戳
     * @param lastTimestamp 上次生成ID的时间截
     * @return 当前时间戳
     */
    protected long tilNextMillis(long lastTimestamp) {
        long timestamp = timeGen();
        while (timestamp <= lastTimestamp) {
            timestamp = timeGen();
        }
        return timestamp;
    }

    /**
     * 返回以毫秒为单位的当前时间
     * @return 当前时间(毫秒)
     */
    protected long timeGen() {
        return System.currentTimeMillis();
    }

    private static Long getWorkId(){
        try {
            String hostAddress = Inet4Address.getLocalHost().getHostAddress();
            int[] ints = StringUtils.toCodePoints(hostAddress);
            int sums = 0;
            for(int b : ints){
                sums += b;
            }
            return (long)(sums % 32);
        } catch (UnknownHostException e) {
            // 如果获取失败,则使用随机数备用
            return RandomUtils.nextLong(0,31);
        }
    }

    private static Long getDataCenterId(){
        int[] ints = StringUtils.toCodePoints(StringUtils.isEmpty(SystemUtils.getHostName())?"defaultvalue":SystemUtils.getHostName());
        int sums = 0;
        for (int i: ints) {
            sums += i;
        }
        return (long)(sums % 32);
    }


    /**
     * 静态工具类
     *
     * @return
     */
    public static Long generateId(){
        long id = idWorker.nextId();
        return id;
    }

    //==================Test===================
    /** 测试 */
    public static void main(String[] args) {
        System.out.println(System.currentTimeMillis());
        long startTime = System.nanoTime();
        for (int i = 0; i < 50000; i++) {
            long id = SnowFlake.generateId();
            System.out.println(id);
        }
        System.out.println((System.nanoTime()-startTime)/1000000+"ms");
    }

}

        使用上述的雪花算法实现,调用 SnowFlake.generateId() 方法来生成唯一的ID。确保为每个实例分配唯一的数据中心ID和机器ID。

        这样,你就能够在童小码项目中生成分布式有序的商品、课程等业务关键字的ID,同时保持高性能和全局唯一性。

4 总结

        1、分布式ID是指在分布式系统中生成的唯一标识符,用于标识不同实体或数据的唯一性

  • 在分布式系统中,多台机器并行处理任务,为了确保生成的ID在整个系统中的唯一性,需要采用特殊的算法来生成分布式ID
  • 常用方式有雪花算法、UUID等

        2、UUID(Universally Unique Identifier)是一种标识符,用于在计算系统中生成全局唯一的ID

  • 由128位的二进制数表示,通常以32位的十六进制字符串形式展示
  • 长度较长、不可读性、无法排序和不适合作为数据库索引等劣势需要在具体应用中进行权衡和考虑

        3、雪花算法(Snowflake Algorithm)是一种常用的分布式ID生成算法

  • 生成全局唯一且有序递增的ID,适用于大规模分布式系统中的标识符需求
  • 相对于UUID,雪花算法ID的好处是长度短并且还是有序递增的

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/575404.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

苍穹外卖day8(2)用户下单、微信支付

文章目录 前言一、用户下单1. 业务流程2. 接口设计3. 数据库设计3.1 订单表orders3.2 订单明细表 order_detail 4. 代码实现 二、订单支付 前言 用户下单 因为订单信息中包含了其他业务中的数据&#xff0c;在逻辑处理中涉及了多个其他业务&#xff0c;比如要判断地址簿、购物…

基于springboot,vue停车管理系统

目录 项目介绍: 图片展示 运行环境 获取方式 项目介绍: 权限划分&#xff1a;用户和管理员 用户&#xff1a; 具有登录&#xff0c;注册&#xff0c;退出登录的功能 首页&#xff1a;展示一个欢饮页面 个人中心&#xff1a;展示关于个人的信息&#xff0c;以及停车信息…

Unreal Engine创建Plugin

打开UE工程&#xff0c;点击编辑&#xff0c;选择插件 点击“新插件”按钮&#xff0c;选择“空白选项”填入插件名字"MultiPlayerPlugin"&#xff0c;填入插件作者、描述&#xff0c;点击“创建插件”按钮打开C工程&#xff0c;即可看到插件目录&#xff0c;编译C工…

ai论文生成神器——快速完成论文任务!

在这个AI写作的时代&#xff0c;大家都在使用AI写作作为论文辅写工具。用过ChatGPT写论文的小伙伴应该都知道&#xff0c;ChatGPT是通过对话或提问形式获取的AI生成内容&#xff0c;提供不了专业的论文写作标准&#xff0c;例如自动生成封面、目录、摘要、参考文献等部分。而专…

面试集中营—ElasticSearch架构篇

一、为什么用ElasticSearch&#xff1f; 1、支持多种数据类型。它可以处理非结构化、数值和地理信息等多种类型的数据&#xff1b; 2、简单的RESTful API。ES提供了一个简单易用的RESTful API&#xff0c;使得它可以从任何编程语言中调用&#xff0c;降低了学习的曲线。 3、近实…

德语口语学习的8种练习方法

简洁明了一点&#xff0c;方便大家理解&#xff0c;我总结了以下8点&#xff1a; 1.模拟对话&#xff1a; 创造实际生活场景&#xff0c;例如购物、问路、餐厅点餐等&#xff0c;并自言自语或者与伙伴一起模拟这些对话。 参加角色扮演活动&#xff0c;通过不同情境练习口语。…

Camtasia2024破解版激活许可证秘钥永久免费使用

Camtasia Studio是一款专业的屏幕录像和视频编辑软件套装&#xff0c;它提供了从屏幕录制到视频编辑、菜单制作、视频播放等一系列功能。以下是对Camtasia Studio及其2024年最新版本的详细介绍。 一、Camtasia Studio概述 Camtasia Studio是一款集屏幕录制、视频剪辑、菜单制…

java:SpringBoot入门

Spring 提供若干子项目,每个项目用于完成特定功能 Spring Boot 可以简化配置并且快速开发 SpringBootWeb快速入门 创建Springboot模块并使用Springweb依赖 在类上添加注解 RestController可以将字符串自动转成json返回数据给页面 再在方法上添加注解 RequestMapping(&…

深入理解GTK、Qt、AWTK:跨平台GUI框架对比

目录标题 GTK特性&#xff1a;优点&#xff1a;缺点&#xff1a; Qt特性&#xff1a;优点&#xff1a;缺点&#xff1a; AWTK特性&#xff1a;优点&#xff1a;缺点&#xff1a; 适用场景 在当今的软件开发领域&#xff0c;图形用户界面&#xff08;GUI&#xff09;的开发是不可…

Log4j日志框架多种日志级别

Log4j日志框架定义了多种日志级别&#xff0c;这些级别按照优先级从高到低排列如下&#xff1a; OFF&#xff1a;这是最高等级的日志级别&#xff0c;用于关闭所有日志记录。FATAL&#xff1a;指出每个严重的错误事件将会导致应用程序的退出。ERROR&#xff1a;表明发生错误事…

python之excel加工处理小案例一则

一、工具用途 工作中&#xff0c;需要对各类excel进行加工处理&#xff0c;当表和字段比较多时&#xff0c;关联条件又有多个&#xff0c;每次通过execl的vlookup之类的关联公式手工可以解决工作需求&#xff0c;但一般耗时较长&#xff0c;且人工统计匹配也存在出错的情况。 …

官方售价299元的自媒体博客资讯类wordpress主题

官方售价299元的自媒体博客资讯类wordpress主题。 自媒体一号是一款由主题巴巴团队原创设计开发的WordPress主题&#xff0c;这款主题页面布局简约大气&#xff0c;设计细节精美考究&#xff0c;内置功能非常强大&#xff0c;通过后台的主题设置面板&#xff0c;你可以轻松自定…

kaggle不显示中文字体

链接&#xff1a;【kaggle】在matplotlib中使用中文字体_kaggle使用中文字体打印图片-CSDN博客 下载字体链接 完整代码&#xff1a; import matplotlib.pyplot as plt import matplotlib.font_manager as font_managerdef plot_df(df, x, y, title"", xlabelDate,…

【Qt常用控件】—— 多元素控件

目录 1.1 List Widget 1.2 Table Widget 1.3 Tree Widget 1.4 小结 Qt 中提供的多元素控件有: QListWidget QListView QTableWidget QTableView QTreeWidget QTreeView xxWidget 和 xxView 之间的区别 以 QTableWidget 和 QTableView 为例&#xff1a; QTableView 是基于…

快速构建Spring boot项目

1、Idea里新建项目 2、创建HelloController 3、运行 4、开发环境热部署 pom.xml 查看目前已有的依赖 配置properties 设置 ctrlshiftalt/ 新版本的compiler.automake.allow.when.app.running已经不在registry里面了&#xff0c;在settings里面的Advanced settings里面Allow au…

【R语言简介】

&#x1f308;个人主页: 程序员不想敲代码啊 &#x1f3c6;CSDN优质创作者&#xff0c;CSDN实力新星&#xff0c;CSDN博客专家 &#x1f44d;点赞⭐评论⭐收藏 &#x1f91d;希望本文对您有所裨益&#xff0c;如有不足之处&#xff0c;欢迎在评论区提出指正&#xff0c;让我们共…

【LLVM】在Windows中配置LLVM开发环境

本文内容 0.动机1. 安装Visual Studio 20192 安装Python3已安装Python未安装Python 3. 配置Visual Studio4.安装LLVM获取源码将LLVM切换到我们的目标版本编译LLVM 0.动机 想着ubuntu用着别手&#xff0c;看看能不能在Windows中进行开发。于是就动手实践了下 Getting Started w…

Android Studio实现内容丰富的安卓养老平台

获取源码请点击文章末尾QQ名片联系&#xff0c;源码不免费&#xff0c;尊重创作&#xff0c;尊重劳动 158安卓养老 1.开发环境 后端用springboot框架&#xff0c;安卓的用android studio开发android stuido3.6 jak1.8 idea mysql tomcat 2.功能介绍 安卓端&#xff1a; 1.注册登…

Mockaroo - 在线生成测试用例利器

简介&#xff1a;Mockaroo 是一个无需安装的在线工具&#xff0c;用于生成大量的自定义测试数据。它支持多种数据格式&#xff0c;如JSON、CSV、SQL和Excel&#xff0c;并能模拟复杂的数据结构。 历史攻略&#xff1a; 测试用例&#xff1a;多条件下编写&#xff0c;懒人妙用…

How to solve matplotlib Chinese garbled characters in Ubuntu 22.04

conda create -n huizhou python3.8conda activate huizhouconda install numpy matplotlibpip install mplfontsmplfonts init# 导入必要的库 import numpy as np import matplotlib.pyplot as plt# 创建角度数组&#xff0c;从0到2π x np.linspace(0, 2 * np.pi, 100)# 计算…
最新文章