r - 如何在R中优化整数参数(和其他不连续参数空间)?

标签 r optimization integer

如果参数空间只是整数(否则是不连续的),该如何优化?

在optim()中使用整数检查似乎不起作用,而且效率很低。

fr <- function(x) {   ## Rosenbrock Banana function
  x1 <- x[1]
  x2 <- x[2]
  value<-100 * (x2 - x1 * x1)^2 + (1 - x1)^2

  check.integer <- function(N){
    !length(grep("[^[:digit:]]", as.character(N)))
  }

  if(!all(check.integer(abs(x1)), check.integer(abs(x2)))){
   value<-NA 
  }
  return(value)

}
optim(c(-2,1), fr)

最佳答案

这里有一些想法。

1.惩罚性优化。
您可以舍入目标函数的参数
并为非诚信人士增加罚款。
但这会造成很多地方极端
因此您可能更喜欢更强大的优化程序,
例如差分进化或粒子群优化。

fr <- function(x) {
  x1 <- round( x[1] )
  x2 <- round( x[2] )
  value <- 100 * (x2 - x1 * x1)^2 + (1 - x1)^2
  penalty <- (x1 - x[1])^2 + (x2 - x[2])^2
  value + 1e3 * penalty
}

# Plot the function
x <- seq(-3,3,length=200)
z <- outer(x,x, Vectorize( function(u,v) fr(c(u,v)) ))
persp(x,x,z,
  theta = 30, phi = 30, expand = 0.5, col = "lightblue", border=NA,
  ltheta = 120, shade = 0.75, ticktype = "detailed")
library(RColorBrewer)
image(x,x,z, 
  las=1, useRaster=TRUE,
  col=brewer.pal(11,"RdYlBu"),
  xlab="x", ylab="y"
)
# Minimize
library(DEoptim)
library(NMOF)
library(pso)
DEoptim(fr, c(-3,-3), c(3,3))$optim$bestmem
psoptim(c(-2,1), fr, lower=c(-3,-3), upper=c(3,3))
DEopt(fr, list(min=c(-3,-3), max=c(3,3)))$xbest
PSopt(fr, list(min=c(-3,-3), max=c(3,3)))$xbest

2.详尽搜索。
如果搜索空间很小,还可以使用网格搜索。
library(NMOF)
gridSearch(fr, list(seq(-3,3), seq(-3,3)))$minlevels

3.使用用户指定的社区进行本地搜索。
在不调整目标函数的情况下,您可以使用某种形式的本地搜索,
您可以在其中指定要检查的点。
这应该快得多,但是对邻域功能的选择极为敏感。
# Unmodified function
f <- function(x) 
  100 * (x[2] - x[1] * x[1])^2 + (1 - x[1])^2

# Neighbour function
# Beware: in this example, with a smaller neighbourhood, it does not converge.
neighbour <- function(x,...)
  x + sample(seq(-3,3), length(x), replace=TRUE)

# Local search (will get stuck in local extrema)
library(NMOF)
LSopt(f, list(x0=c(-2,1), neighbour=neighbour))$xbest
# Threshold Accepting
TAopt(f, list(x0=c(-2,1), neighbour=neighbour))$xbest

4.禁忌搜索。
为了避免一次又一次地探索相同的点,您可以使用
tabu search
也就是说,请记住最后k点,以避免再次访问它们。
get_neighbour_function <- function(memory_size = 100, df=4, scale=1){
  # Static variables
  already_visited <- NULL
  i <- 1
  # Define the neighbourhood
  values <- seq(-10,10)
  probabilities <- dt(values/scale, df=df)
  probabilities <- probabilities / sum(probabilities)
  # The function itself
  function(x,...) {
    if( is.null(already_visited) ) {
      already_visited <<- matrix( x, nr=length(x), nc=memory_size )
    }
    # Do not reuse the function for problems of a different size
    stopifnot( nrow(already_visited) == length(x) )
    candidate <- x
    for(k in seq_len(memory_size)) {
      candidate <- x + sample( values, p=probabilities, length(x), replace=TRUE )
      if( ! any(apply(already_visited == candidate, 2, all)) )
        break
    }
    if( k == memory_size ) {
      cat("Are you sure the neighbourhood is large enough?\n")
    } 
    if( k > 1 ) {
      cat("Rejected", k - 1, "candidates\n")
    }
    if( k != memory_size ) {
      already_visited[,i] <<- candidate
      i <<- (i %% memory_size) + 1
    }
    candidate
  }
}

在以下示例中,它实际上不起作用:
我们只会移动到最接近的本地最小值。
在更高的维度上,情况变得更糟:
邻居是如此之大,以至于我们从不去缓存
已经访问的点数。
f <- function(x) {
  result <- prod( 2 + ((x-10)/1000)^2 - cos( (x-10) / 2 ) )  
  cat(result, " (", paste(x,collapse=","), ")\n", sep="")
  result
}
plot( seq(0,1e3), Vectorize(f)( seq(0,1e3) ) )

LSopt(f, list(x0=c(0,0), neighbour=get_neighbour_function()))$xbest
TAopt(f, list(x0=c(0,0), neighbour=get_neighbour_function()))$xbest
optim(c(0,0), f, gr=get_neighbour_function(), method="SANN")$par

差异进化的效果更好:我们只获得局部最小值,
但它比最近的更好。
g <- function(x) 
  f(x) + 1000 * sum( (x-round(x))^2 )
DEoptim(g, c(0,0), c(1000,1000))$optim$bestmem

禁忌搜索通常用于纯粹的组合问题
(例如,当搜索空间是一组树或图时)
对于整数问题似乎并不是一个好主意。

关于r - 如何在R中优化整数参数(和其他不连续参数空间)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11110848/

相关文章:

R- 基于其他列的现值的新列

optimization - Intel Skylake 的统一调度器与 AMD Zen 的单独调度器

optimization - SSE 程序在 AMD 上比在 Intel 上花费的时间长得多

c++ - 一个好的 C++ 编译器会优化引用吗?

objective-c - 如何暂停 objective-c 不到一秒的时间

r - ggplot2 y 轴限制改变绘图

r - 跳到一个大的txt文件中的某个位置

r - 如何修复零膨胀泊松回归的错误

python - 如何查找整数中的数字长度?

java - 如何在 java 中将字符串数字转换为逗号分隔的整数?