php - Mongo Map Reduce 第一次

标签 php mongodb mapreduce mongodb-php

第一次在这里使用 Map/Reduce 用户,并使用 MongoDB。我有很多页面访问数据,我想通过使用 Map/Reduce 来了解这些数据。下面基本上是我想做的,但作为一个 Map/Reduce 的初学者,我认为这超出了我的知识范围!

  1. 浏览过去 30 天内访问过的所有页面,其中 external = true。
  2. 然后对于每个页面,查找所有访问次数
  3. 按推荐位置对所有访问进行分组
  4. 对于每个推荐位置,计算有多少人访问了具有特定“类型”并且“标签”中也有特定单词的页面。

数据库和集合被组织为

$mongo->dbname->visits

一个示例文档是:

{"url": "www.example.com", "type": "a", "refer": {"external": true, "domain": "twitter.com", "url": "http://www.twitter.com/page"}, "page": "1235", "user": "1232", "time": 1234567890}

然后我想找到带有特定标签的B类型文档。

{"url": "www.example.com", "type": "b", "page": "745", "user": "1232", "time": 1234567890, "tags": {"a", "b", "c"}}

如果有影响,我正在使用普通的 Mongo PHP 扩展。

最佳答案

好的,我想出了一些我认为可以做你想做的事。请注意,这可能不完全有效,因为我不是 100% 确定您的架构(考虑到您的示例显示 refer 在类型 a 中可用,但不是 b (我不确定这是否是一个遗漏,或者考虑到您想通过推荐人查看什么)...无论如何,这就是我想出的:

map 功能:

function() {
    var obj = {
        "types": {},
        "tags": {},
    }
    obj.types[this.type] = 1;
    if (this.tags) {
        for (var tag in this.tags) {
            obj.tags[this.tags[tag]] = 1;
        }
    }
    emit(this.refer.url, obj);
}

Reduce 函数:

function(key, values) {
    var obj = {
        "types": {},
        "tags": {},
    }
    for (var i = 0; i < values.length; i++) {
        for (var type in values[i].types) {
            if (!type in obj.types) {
                obj.types[type] = 0;
            }
            obj.types[type] += values[i].types[type];
        }
        for (var tag in values[i].tags) {
            if (!tag in obj.tags) {
                obj.tags[tag] = 0;
            }
            obj.tags[tag] += values[i].tags[tag];
        }
    }
    return obj;
}

所以基本上,它的工作原理是这样的。 Map 函数使用 refer.url 的键(我根据您的描述猜测)。所以最终结果看起来像一个数组,其中 _id 等于 refer.url(它基于 url 分组)。然后它创建一个对象,它下面有两个对象(类型和标签)。对象的原因是 map 和 reduce 可以发出相同的格式对象。除此之外,我认为它应该是相对不言自明的(如果你不明白,我可以尝试解释更多)...

所以让我们在 PHP 中实现它(假设 $map$reduce 是字符串,为了简洁起见,上面包含了它们):

$mapFunc = new MongoCode($map);
$reduceFunc = new MongoCode($reduce);
$query = array(
    'time' => array('$gte' => time() - (60*60*60*24*30)),
    'refer.external' => true
);
$collection = 'visits';
$command = array(
    'mapreduce' => $collection,
    'map' => $mapFunc,
    'reduce' => $reduceFunc,
    'query' => $query,
);

$statsInfo = $db->command($command);

$statsCollection = $db->selectCollection($sales['result']);

$stats = $statsCollection->find();

foreach ($stats as $stat) {
    echo $stats['_id'] .' Visited ';
    foreach ($stats['value']['types'] as $type => $times) {
        echo "Type $type $times Times, ";
    }
    foreach ($stats['value']['tags'] as $tag => $times) {
        echo "Tag $tag $times Times, ";
    }
    echo "\n";
}

注意,我没有测试过这个。这正是我根据对您的架构的理解以及对 Mongo 及其 Map-Reduce 实现的理解得出的结论......

关于php - Mongo Map Reduce 第一次,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3002841/

相关文章:

php - 如何从包外部访问 Symfony 2 包配置?

mongodb - 用作图形数据库在 MongoDb 中查找 "friends"的 "friends"

javascript - 如何使用 node.js 将 _bsontype objectID 值转换为 string/objectID 以插入到 mongoDB 中

hadoop - Hive-UDF怎么了?如何设置Hive的 map 编号?

amazon-ec2 - 亚马逊云上的 Hadoop

php - 通过 PHP 从 Twitter 解码 JSON 提要不起作用?

php - 随机记录 Mysql PHP

php - 在 Yii 供应商中安装 fpdf

mongodb - 无法在 Ubuntu 14.04 中使用 sh robomongo.sh 运行 robomongo.sh

scala - 在 Spark 中操作大量列时出现 StackOverflowError