有一个名为电影的模态,其中包含有关电影的信息。
电影模态
var mongoose = require('mongoose');
var movieSchema = new mongoose.Schema({
m_tmdb_id: {
type: Number,
unique: true,
index: true
},
m_backdrop_path: {
type: String,
},
m_budget: {
type: Number,
},
m_homepage: {
type: String
},
m_imdb_id: {
type: String,
},
m_original_language: {
type: String
},
m_original_title: {
type: String
},
m_poster_path: {
type: String
},
m_poster_key: {
type: String
},
m_release_date: {
type: Date
},
m_revenue: {
type: Number
},
m_runtime: {
type: Number
},
m_title: {
type: String
},
m_genres: {
type: Array
},
created_at: {
type: Date
},
updated_at: {
type: Date,
default: Date.now
}
});
var MovieModel = mongoose.model('Movie', movieSchema);
module.exports = {
movie: MovieModel
}
我需要在每个查询 [Pagination] 中从集合 Movie 中选择具有不同条件的 10 个项目。我在 API 中添加了 3 个条件 [基于通用名称、发布日期、语言]。
JS代码
router.post('/movies', function(req, res, next) {
var perPage = parseInt(req.query.limit);
var page = req.query.page;
var datefrom = new Date();
var dateto = new Date();
var generNames = req.body.generNames;
dateto.setMonth(dateto.getMonth() - 2);
var queryOptions = {
$and: [{
'm_release_date': {
$lte: datefrom,
$gte: dateto
}
}, {
"m_genres.name": {
$in: generNames
}
}, {
'm_original_language': 'en'
}, ]
};
Movie
.find(queryOptions)
.select('_id m_tmdb_id m_poster_path m_original_title')
.sort('-m_release_date')
.limit(perPage)
.skip(perPage * page)
.exec(function(err, movies) {
if (movies) {
return res.status(200).json(movies);
}
}).catch(function(error) {
return res.status(500).json(error);
});
});
我需要再添加一个条件,条件是从集合电影中选择具有年份集合中的发行日期[m_release_date]的项目[例如:2003,2004,2010等]。我该怎么做?在此处输入代码
示例:
电影收藏
[
{
"_id": "59420dff3d729440f200bccc",
"m_tmdb_id": 453651,
"m_original_title": "PIETRO",
"m_poster_path": "/3sTFUZorLGOU06A7P3XxjLVKKGD.jpg",
"m_release_date": "2017-07-14T00:00:00.000Z",
"m_runtime": 8,
"m_genres": [{
"id": 18,
"name": "Drama"
}]
},
{
"_id": "594602610772b119e788edab",
"m_tmdb_id": 425136,
"m_original_title": "Bad Dads",
"m_poster_path": null,
"m_release_date": "2017-07-14T00:00:00.000Z",
"m_runtime": 0,
"m_credits_cast": [],
"m_genres": [{
"id": 35,
"name": "Comedy"
}]
},
{
"_id": "59587747d282843883df755e",
"m_tmdb_id": 364733,
"m_original_title": "Blind",
"m_poster_path": "/cXyObe5aB63ueOndEXxXabgAvIi.jpg",
"m_release_date": "2017-07-14T00:00:00.000Z",
"m_runtime": 105,
"m_genres": [{
"id": 18,
"name": "Drama"
}]
},
{
"_id": "595d93f9c69ab66c4f48254f",
"m_tmdb_id": 308149,
"m_original_title": "The Beautiful Ones",
"m_poster_path": "/kjy1obH5Oy1IsjTViYVJDQufeZP.jpg",
"m_release_date": "2017-07-14T00:00:00.000Z",
"m_runtime": 94,
"m_genres": [{
"id": 18,
"name": "Drama"
}]
},
{
"_id": "59420de63d729440f200bcc7",
"m_tmdb_id": 460006,
"m_original_title": "Черная вода",
"m_poster_path": "/kpiLwx8MGGWgZMMHUnvydZkya0H.jpg",
"m_release_date": "2017-07-13T00:00:00.000Z",
"m_runtime": 0,
"m_genres": []
},
{
"_id": "594602390772b119e788eda3",
"m_tmdb_id": 281338,
"m_original_title": "War for the Planet of the Apes",
"m_poster_path": "/y52mjaCLoJJzxfcDDlksKDngiDx.jpg",
"m_release_date": "2017-07-13T00:00:00.000Z",
"m_runtime": 142,
"m_genres": [{
"id": 28,
"name": "Action"
}
]
}
]
API请求
最佳答案
修复数据以实现最高效率
老实说,实现此目的的最有效方法是在 m_release_year
数据中创建一个新字段。然后提供 $in
就变得很简单了查询条件代替日期范围,但这当然可以使用索引。
有了这样的字段,启动查询的代码就变成了:
// Just to simulate the request
const req = {
body: {
"generNames": ["Action"],
"selectedYear": ["2003,2004,2005,2017"]
}
}
// Your selectedYear input looks wrong. So correcting from a single string
// to an actual array of integers
function fixYearSelection(input) {
return [].concat.apply([],input.map(e => e.split(",") )).map(e => parseInt(e) ).sort()
}
// Outputs like this - [ 2003, 2004, 2005, 2017 ]
let yearSelection = fixYearSelection(req.body.selectedYear);
Movie.find({
"m_release_year": { "$in": yearSelection },
"m_genres.name": { "$in": req.body.generNames },
"m_original_language": "en"
})
.select('_id m_tmdb_id m_poster_path m_original_title')
.sort('-m_release_date')
.limit(perPage)
.skip(perPage * page)
.exec(function(err, movies) {
将新字段放入数据中很简单,只需在 mongo
shell 中运行即可:
let ops = [];
db.movies.find({ "m_release_year": { "$exists": false } }).forEach( doc => {
ops.push({
"updateOne": {
"filter": { "_id": doc._id },
"update": { "$set": { "m_release_year": doc.m_release_date.getUTCFullYear() } }
});
if ( ops.length >= 1000 ) {
db.movies.bulkWrite(ops);
ops = [];
}
});
if ( ops.length > 0 ) {
db.movies.bulkWrite(ops);
ops = [];
}
这将迭代集合中的所有项目并“提取”年份信息,然后写入新字段。明智的做法是创建一个与查询选择中使用的字段相匹配的索引。
强制计算
如果没有这个,那么您基本上就是“强制计算”,并且没有数据库可以有效地做到这一点。 MongoDB中的两个方法是使用 $where
或$redact
,其中“后者”应始终优先于前者使用,因为至少 $redact
使用 native 编码操作进行比较,而不是 $where
的 JavaScript 评估,运行速度慢得多。
// Just to simulate the request
const req = {
body: {
"generNames": ["Action"],
"selectedYear": ["2003,2004,2005,2017"]
}
}
// Your selectedYear input looks wrong. So correcting from a single string
// to an actual array of integers
function fixYearSelection(input) {
return [].concat.apply([],input.map(e => e.split(",") )).map(e => parseInt(e) ).sort()
}
// Outputs like this - [ 2003, 2004, 2005, 2017 ]
let yearSelection = fixYearSelection(req.body.selectedYear);
/*
* Not stored, so we try to "guestimate" the reasonable "range" to at
* least give some query condtion on the date and not search everything
*/
var startDate = new Date(0),
startDate = new Date(startDate.setUTCFullYear(yearSelection[0])),
endDate = new Date(0),
endDate = new Date(endDate.setUTCFullYear(yearSelection.slice(-1)[0]+1));
// Helper to switch our $redact "if" based on supported MongoDB
const version = "3.4";
function makeIfCondition() {
return ( version === "3.4" )
? { "$in": [ { "$year": "$m_release_date" }, yearSelection ] }
: { "$or": yearSelection.map(y =>
({ "$eq": [{ "$year": "$m_release_date" }, y })
) };
}
然后使用 $redact
:
Movie.aggregate(
[
{ "$match": {
"m_release_date": {
"$gte": startDate, "$lt": endDate
},
"m_genres.name": { "$in": req.body.generNames },
"m_original_language": "en"
}},
{ "$redact": {
"$cond": {
"if": makeIfCondition(),
"then": "$$KEEP",
"else": "$$PRUNE"
}
}},
{ "$sort": { "m_release_date": -1 } },
{ "$project": {
"m_tmdb_id": 1,
"m_poster_path": 1,
"m_original_title": 1
}},
{ "$skip": perPage * page },
{ "$limit": perPage }
],
(err,movies) => {
}
)
或通过 $where
:
Movie.find({
"m_release_date": {
"$gte": startDate, "$lt": endDate
},
"m_genres.name": { "$in": req.body.generNames },
"m_original_language": "en",
"$where": function() {
return yearSelection.indexOf(this.m_release_date.getUTCFullYear()) !== -1
}
})
.select('_id m_tmdb_id m_poster_path m_original_title')
.sort('-m_release_date')
.limit(perPage)
.skip(perPage * page)
.exec(function(err, movies) {
基本逻辑是通过 $year
来提取或.getUTCFullYear()
从 m_release_date
字段获取当前年份,并将其与 yearSelection
列表进行比较,以便仅返回匹配的年份。
对于 $redact
的使用实际比较最有效的方法是通过 $in
对于最新版本(3.4 及更高版本)或使用 $or
中的值我们在哪里有效.map()
到条件数组上,而不是直接将数组作为参数应用。
结论
这里的一般建议是,如果您打算定期查询数据,则将实际数据包含在您的集合中。有了实际值,您就可以在字段上放置索引,常规查询运算符可以使用这些值并利用索引。
如果不将“年份”的值放入集合中,则需要将后续“计算”应用于所有可能的条目以确定哪个匹配。所以效率不高。
即使在这个例子中,我们也尝试通过至少根据给定条目抛出日期的“可能范围”(从最小到最大进行推测)来“恢复”一些效率。当然,该选择中存在“未使用的年份”,但这比不提供任何内容并仅根据计算进行选择要好。
关于javascript - 在 Mongodb 中根据年份查找文档,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45139789/