博客
关于我
Mongodb中的聚合函数使用:按月统计数量
阅读量:798 次
发布时间:2023-02-09

本文共 2034 字,大约阅读时间需要 6 分钟。

MongoDB中有一个名为stat_list的集合,存储了每天的统计数据。为了按月统计数据,我们需要使用MongoDB的聚合函数aggregate。

步骤一:处理daily_count字段

当前的daily_count字段存储的是带有单位的字符串,例如“164.34万”。为了避免数据处理问题,我们需要将其去掉单位后转换为整数。可以使用正则表达式提取数字部分:

friendsCount = item.daily_count.match(/.*?(?=万)/);newFriendsCount = parseFloat(friendsCount[0]);

更新后的daily_count将从“164.34万”变为“164.34”。

步骤二:提取月份信息

date字段的值通常格式为“YYYY-MM-DD”,例如“2019-06-12”。我们可以使用substr函数提取月份:

month = substr(date, 0, 7); // 提取前7个字符,例如“2019-06”中的“06”

步骤三:使用aggregate函数进行分组和转换

在MongoDB中,使用aggregate函数可以对数据进行批量操作。以下是一个示例:

db.getCollection('stat_list_copy').aggregate([    {        $project: {            date: {                $regexMatch: {                     path: '$date',                    template: new Date().toISOString().split('T')[0]                }            },            month: {                $substr: {                     path: '$date',                    offset: 0,                    length: 2                }            },            daily_count: {                $toInteger: {                    $cond: {                        if: {                            $type: 'string',                            $eq: ['$', '万']                        },                        then: '$daily_count',                        else: 0                    }                }            }        }    },    {        $group: {            _id: '$month',            total: {                $sum: '$daily_count'            }        }    }])

步骤四:逐个更新数据

在处理过程中,可以选择逐个更新数据:

db.getCollection('stat_list_copy').find().forEach(function(item) {    friendsCount = item.daily_count;    friendsCount = (friendsCount.match(/.*?(?=万)/));    newFriendsCount = parseFloat(friendsCount[0]);    db.getCollection('stat_list_copy').update({'_id': item._id}, {        $set: {            'daily_count': newFriendsCount        }    });});

注意事项

  • 数据预处理:建议在处理原始数据之前,先复制一份数据集stat_list_copy,以避免处理过程中数据来源被破坏。
  • 性能优化:使用find()逐个处理可能会影响性能,建议根据具体情况选择合适的批量处理方式。
  • 索引优化:在进行频繁查询和更新操作时,确保date和month字段有合适的索引,以提高查询效率。
  • 通过以上步骤,可以实现按月统计的需求。记得在实际应用中根据需要调整正则表达式和处理逻辑,以适应不同的数据格式和业务需求。

    转载地址:http://djffk.baihongyu.com/

    你可能感兴趣的文章
    OAuth2.0_完善环境配置_把资源微服务客户端信息_授权码存入到数据库_Spring Security OAuth2.0认证授权---springcloud工作笔记149
    查看>>
    OAuth2.0_授权服务配置_Spring Security OAuth2.0认证授权---springcloud工作笔记140
    查看>>
    OAuth2.0_授权服务配置_令牌服务和令牌端点配置_Spring Security OAuth2.0认证授权---springcloud工作笔记143
    查看>>
    OAuth2.0_授权服务配置_客户端详情配置_Spring Security OAuth2.0认证授权---springcloud工作笔记142
    查看>>
    OAuth2.0_授权服务配置_密码模式及其他模式_Spring Security OAuth2.0认证授权---springcloud工作笔记145
    查看>>
    OAuth2.0_授权服务配置_资源服务测试_Spring Security OAuth2.0认证授权---springcloud工作笔记146
    查看>>
    OAuth2.0_环境介绍_授权服务和资源服务_Spring Security OAuth2.0认证授权---springcloud工作笔记138
    查看>>
    OAuth2.0_环境搭建_Spring Security OAuth2.0认证授权---springcloud工作笔记139
    查看>>
    oauth2.0协议介绍,核心概念和角色,工作流程,概念和用途
    查看>>
    OAuth2.0四种模式的详解
    查看>>
    OAuth2授权码模式详细流程(一)——站在OAuth2设计者的角度来理解code
    查看>>
    oauth2登录认证之SpringSecurity源码分析
    查看>>
    OAuth2:项目演示-模拟微信授权登录京东
    查看>>
    OA系统多少钱?OA办公系统中的价格选型
    查看>>
    OA系统选型:选择好的工作流引擎
    查看>>
    OA让企业业务流程管理科学有“据”
    查看>>
    OA项目之会议通知(查询&是否参会&反馈详情)
    查看>>
    Vue.js 学习总结(13)—— Vue3 version 计数介绍
    查看>>
    OA项目之我的会议(会议排座&送审)
    查看>>
    OA项目之我的会议(查询)
    查看>>